暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种分布式数据库分布键的优选方法_CN117435594B_南大通用.pdf
20
9页
0次
2024-06-11
免费下载
(19)国家知识产权局
(12)发明专利
(10)授权公告号
(45)授权公告日
(21)申请号 202311735374 .3
(22)申请日 2023 .12.18
(65)同一申请的已公布的文献号
申请公布号 CN 117435594 A
(43)申请公布日 2024 .01 .23
(73)专利权人 天津南大通用数据技术股份有限
公司
地址 300384 天津市滨海新区华苑产业区
海泰发展六道6号海泰绿色产业基地J
(72)发明人 丁明峰 吴明远 
(74)专利代理机构 天津企兴智财知识产权代理
有限公司 12226
专利代理师 石倩倩
(51)Int.Cl.
G06F
16/22
(2019 .01)
G06F
16/2453
(2019 .01)
G06F
16/2458
(2019 .01)
(56)对比文件
CN 110019231 A ,2019.07 .16
CN 113297250 A ,2021 .08 .24
US 2022284024 A1 ,2022 .09.08
CN 107977446 A ,2018 .05.01
CN 111881160 A ,2020 .11 .03
CN 112115123 A ,2020 .12.22
CN 112789606 A ,2021 .05 .11
CN 114238481 A ,2022.03 .25
CN 114443691 A ,2022.05 .06
CN 114791912 A,2022 .07 .26
CN 115757477 A ,2023.03 .07
CN 116126901 A ,2023 .05 .16
CN 116860789 A,2023 .10.10
WO 2023138665 A1 ,2023.07 .27
笨鸟成长记 .GreenPlum分布键设计一次
性教会你 .微信公众平台.2023 ,全文.
Pivotal .Pivotal践行见远技术篇之13-
Greenplum的开发与优化 .微信公众平台
.2016,全文. ()
审查员 王艳芬
(54)发明名称
一种分布式数据库分布键的优选方法
(57)摘要
本发明提供了一种分布式数据库分布键的
优选方法包括收集分布式数据库在运行期间
执行的SQL语句和每条SQL的运行信息记录分布
式数据库中每张表的重分布代价以及非重分布
代价并记录与每张表相关联的候选键根据收
集的运行信息对每条SQL的运行信息进行处理
计算出每张表中每个相关联的候选键的代价
所有代价进行汇总得出运行期间每张表各个候
选键的总代价选择每张表总代价最高的候选键
作为最优分布键并将最优分布键应用到分布式
数据库中本发明有益效果解决了传统上依赖
人工选择分布键的诸多弊端大幅度提升了执行
效率解决了分布键不合理导致的性能问题
[转续页]
权利要求书1页 说明书5页 附图1页
CN 117435594 B
2024.04.16
CN 117435594 B
(56)对比文件
邹承明;谢义;吴佩.基于Greenplum数据库
的查询优化 .计算机应用.2018 ,(02) ,全文 .
师金钢;鲍玉斌;冷芳玲;于戈 .基于
MapReduce的关系型数据仓库并行查询.东北大
学学报(自然科学版) .2011 ,(05) ,全文 .
2/2
2
[接上页]
CN 117435594 B
1 .一种分布式数据库分布键的优选方法其特征在于包括
收集分布式数据库在运行期间执行的SQL语句和每条SQL语句的运行信息
记录分布式数据库中每张表的重分布代价以及非重分布代价并记录与每张表相关联
的候选键
根据收集的运行信息对每条SQL语句的运行信息进行处理计算出每张表中每个相关
联的候选键的代价并选出最优分布键
将最优分布键应用到分布式数据库中
其中计算出每张表中每个相关联的候选键的代价并选出最优分布键的过程包括
计算非重分布代价H
Tm
对于每张表Tm计算所有SQL查询中当前表的非重分布代价之
和,其公式为
计算重分布代价H
TmFn
对于表Tm中的每个候选键Fn计算所有SQL查询中的重分布代价
之和其公式为
选择最优分布键对于每张表Tm比较非重分布代价和所有候选键的重分布代价并找
出集合{H
Tm
,H
TmF1
,H
TmF2
, ,H
TmFN
}中的最大值
若最大值为H
Tm
则当前的分布键是最优的
若最大值为H
TmFn
则将最优分布键更换为Fn
2.根据权利要求1所述的一种分布式数据库分布键的优选方法其特征在于
收集分布式数据库在运行期间每条SQL语句的运行信息的过程包括
在分布式数据库中修改优化器根据分布式数据库的统计信息生成对SQL语句的运行
信息的估计值
在分布式数据库中修改执行器根据SQL语句的执行过程统计SQL语句的运行信息
3 .根据权利要求2所述的一种分布式数据库分布键的优选方法其特征在于
在分布式数据库中修改分布式数据库的优化器或执行器收集SQL语句的运行信息的
过程包括
将运行信息的收集过程中涉及SQL查询的关联条件字段作为分布列的候选键
在收集过程中保存收集的运行信息在收集结束后进行汇总统计
4 .根据权利要求1所述的一种分布式数据库分布键的优选方法其特征在于
当收集到满足计算每张表的代价的SQL语句运行信息后调用停止函数停止数据收集
在停止函数中遍历收集到的信息开始计算每张表的代价
5 .一种电子设备包括处理器以及与处理器通信连接且用于存储所述处理器可执行
指令的存储器其特征在于所述处理器用于执行上述权利要求14任一所述的一种分布式
数据库分布键的优选方法
6 .一种服务器其特征在于包括至少一个处理器以及与所述处理器通信连接的存储
器,所述存储器存储有可被所述至少一个处理器执行的指令所述指令被所述处理器执行
以使所述至少一个处理器执行如权利要求14任一所述的一种分布式数据库分布键的优选
方法
7 .一种计算机可读取存储介质存储有计算机程序其特征在于所述计算机程序被处
理器执行时实现权利要求14任一项所述的一种分布式数据库分布键的优选方法
权 利 要 求 书
1/1
2
CN 117435594 B
3
of 9
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。