1 .一种基于数据分区的分布式数据库导出方法,其特征在于,包括:
解析待导出数据所在表的DDL,获取待导出数据的分片、分区信息;
根据待导出数据的分片、分区信息构造各分区数据对应的导出语句;
创建待导出数据的直方图,反馈待导出数据的分布情况;
根据待导出数据的分布情况构造各导出语句的where子语句,对待导出数据进一步分
块,使并发导出的数据量趋向于平均;
利用构造好的各导出语句并发导出数据。
2 .如权利要求1所述的基于数据分区的分布式数据库导出方法,其特征在于,所述创建
待导出数据的直方图,包括:对于复制分发的表,按照用户自定义where条件、主键、唯一索
引、普通索引的优先级顺序,使用其一对任意一个分片上的表创建直方图。
3 .如权利要求1所述的基于数据分区的分布式数据库导出方法,其特征在于,所述创建
待导出数据的直方图,包括:对于依赖于分发字段的表,若各分片数据非均匀分布,根据分
发键创建直方图;若各分片数据趋向于均匀分布,按照主键、唯一索引、普通索引的优先级
顺序,使用其一创建直方图。
4 .如权利要求1所述的基于数据分区的分布式数据库导出方法,其特征在于,所述根据
待导出数据的分布情况构造各导出语句的where子语句,对待导出数据进一步分块,使并发
导出的数据量趋向于平均,包括:对于整型字段的直方图,当数据分布呈正态分布,构造
where子语句将数据量少的区间合并,使并发导出的数据量趋向于平均。
5 .如权利要求1所述的基于数据分区的分布式数据库导出方法,其特征在于,所述根据
待导出数据的分布情况构造各导出语句的where子语句,对待导出数据进一步分块,使并发
导出的数据量趋向于平均,包括:对于非整型字段的直方图,根据字段名及其对应数据的分
布特征,使用模糊匹配或全匹配构造where子语句,使并发导出的数据量趋向于平均。
6 .如权利要求1所述的基于数据分区的分布式数据库导出方法,其特征在于,当用户指
定了待导出数据的分片、分区信息,则无需解析待导出数据所在表的DDL,根据用户指定的
分片、分区信息构造各分区数据对应的导出语句。
7 .一种基于数据分区的分布式数据库导出装置,其特征在于,包括:
解析模块,用于解析待导出数据所在表的DDL,获取待导出数据的分片、分区信息;
导出语句构造模块,用于根据待导出数据的分片、分区信息构造各分区数据对应的导
出语句;
创建模块,用于创建待导出数据的直方图,反馈待导出数据的分布情况;
子语句构造模块,用于根据待导出数据的分布情况构造各导出语句的where子语句,对
待导出数据进一步分块,使并发导出的数据量趋向于平均;
导出模块,用于利用构造好的各导出语句并发导出数据。
8.一种电子设备,包括处理器和存储器,所述存储器存储有可在所述处理器上运行的
程序,其特征在于,所述程序被所述处理器执行时实现权利要求1‑6任一项所述的基于数据
分区的分布式数据库导出方法的步骤。
9 .一种计算机可读存储介质,存储有至少一个程序,其特征在于,所述至少一个程序可
被至少一个处理器执行,以实现权利要求1‑6任一项所述的基于数据分区的分布式数据库
导出方法的步骤。
权 利 要 求 书
1/1 页
2
文档被以下合辑收录
相关文档
评论