暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种分布式数据库推荐索引生成方法_CN116483831B_上海沄熹科技有限公司.pdf
72
10页
0次
2024-03-28
免费下载
(19)国家知识产权局
(12)发明专利
(10)授权公告号
(45)授权公告日
(21)申请号 202310383758.7
(22)申请日 2023 .04 .12
(65)同一申请的已公布的文献号
申请公布号 CN 116483831 A
(43)申请公布日 2023 .07 .25
(73)专利权人 上海沄熹科技有限公司
地址 200120 上海市浦东新区中国上海
自由贸易试验区张东路1158丹桂
10592305-22
(72)发明人 张晖 吕楚梦 邹彤 任鲲鹏 
蒋青春 
(74)专利代理机构 济南信达专利事务所有限公
37100
专利代理师 孙晶伟
(51)Int.Cl.
G06F
16/22
(2019 .01)
G06F
16/242
(2019 .01)
G06F
16/27
(2019 .01)
G06F
16/28
(2019 .01)
G06F
16/2455
(2019 .01)
(56)对比文件
CN 104361113 A ,2015 .02.18
CN 108170775 A ,2018.06 .15
CN 111797118 A,2020 .10 .20
CN 114064689 A ,2022 .02 .18
CN 115237920 A ,2022.10 .25
US 6345266 B1 ,2002.02 .05
US 6728720 B1 ,2004 .04 .27
粟含.基于代价的慢查询优化建议 .
https://tech .meituan .com/2022/04/21/
slow-query-optimized-advice-driven-by-
cost-model .html.2022 ,1-23 .
David Broneske .Accelerating multi-
column selection predicates in main-
memory the Elf approach.IEEE.2017 ,
647-658.
审查员 苏玉兰
(54)发明名称
一种分布式数据库推荐索引生成方法
(57)摘要
本发明公开一种分布式数据库推荐索引生
成方法涉及数据库管理技术领域筛选索引存
在优化空间的SQL语句作为不健康语句从访问
模式出发查找与不健康语句有关的谓词并从所
述谓词中筛选出数据库运行性能与索引有关的
目标谓词根据目标谓词预设谓词优先级和谓词
组合规则根据谓词优先级及谓词组合规则
cardinality获得候选索引检查访问模式中目
标谓词涉及的字段与当前的候选索引的字段的
重合情况对于满足重合条件的字段所对应的候
选索引计算其统计信息计算统计信息后验证
候选索引并将验证后候选索引应用负载所含
全部SQL语句所引用的数据对象及其关联的其他
数据对象发送至数据仓库
权利要求书2页 说明书6页 附图1页
CN 116483831 B
2024.01.30
CN 116483831 B
1 .一种分布式数据库推荐索引生成方法其特征是根据应用所在的数据库集群获取
应用负载所含全部SQL语句所引用的数据对象及其关联的其他数据对象筛选索引存在优
化空间的SQL语句作为不健康语句从访问模式出发查找与不健康语句有关的谓词并从所
述谓词中筛选出数据库运行性能与索引有关的目标谓词根据目标谓词预设谓词优先级和
谓词组合规则根据谓词优先级及谓词组合规则获取多种字段组合字段组合结合字段的
cardinality获得候选索引
根据候选索引创建候选索引的DDL语句
根据候选索引对应的所有访问模式检查访问模式中目标谓词涉及的字段与当前的候
选索引的字段的重合情况对于满足重合条件的字段所对应的候选索引计算其统计信息
计算统计信息后验证候选索引并将验证后候选索引应用负载所含全部SQL语句所引
用的数据对象及其关联的其他数据对象发送至数据仓库通过数据仓库反馈并推荐候选索
引给数据库节点
2 .根据权利要求1所述的一种分布式数据库推荐索引生成方法其特征是所述根据候
选索引创建候选索引的DDL语句包括
利用DDL语句生成器基于候选索引创建候选索引的DDL语句
通过DDL语句生成器读取候选索引中操作类型以及字段内容所述操作类型包括创建
修改及删除,通过DDL语句生成器输出相应的创建修改及删除索引的DDL语句
3 .根据权利要求1所述的一种分布式数据库推荐索引生成方法其特征是所述计算统
计信息包括
获取每个候选索引对应的所有访问模式
检查访问模式中目标谓词涉及的字段与当前的候选索引的字段的重合情况对于满足
重合条件的字段所对应的候选索引检查其访问模式是否存在实际过滤率若存在则使用
所述实际过滤率估算候选索引的统计信息
4 .根据权利要求1所述的一种分布式数据库推荐索引生成方法其特征是所述计算统
计信息后验证候选索引包括
验证候选索引是否能够被SQL语句所使用
并针对提出候选索引所用的不健康语句使用候选索引后预估数据库收益变化是否能
够高于阈值
5 .一种分布式数据库推荐索引生成装置其特征是包括数据收集模块不健康语句分
析模块候选索引生成模块和索引验证及优化模块
数据收集模块根据应用所在的数据库集群获取应用负载所含全部SQL语句所引用的
数据对象及其关联的其他数据对象不健康语句分析模块筛选索引存在优化空间的SQL
句作为不健康语句候选索引生成模块从访问模式出发查找与不健康语句有关的谓词
从所述谓词中筛选出数据库运行性能与索引有关的目标谓词根据目标谓词预设谓词优先
级和谓词组合规则根据谓词优先级及谓词组合规则获取多种字段组合字段组合结合字
段的cardinality获得候选索引
候选索引生成模块根据候选索引创建候选索引的DDL语句
候选索引生成模块根据候选索引对应的所有访问模式检查访问模式中目标谓词涉及
的字段与当前的候选索引的字段的重合情况对于满足重合条件的字段所对应的候选索
权 利 要 求 书
1/2
2
CN 116483831 B
2
引,计算其统计信息
索引验证及优化模块计算统计信息后验证候选索引并将验证后候选索引应用负载
所含全部SQL语句所引用的数据对象及其关联的其他数据对象发送至数据仓库通过数据
仓库反馈并推荐候选索引给数据库节点
6 .根据权利要求5所述的一种分布式数据库推荐索引生成装置其特征是所述候选索
引生成模块根据候选索引创建候选索引的DDL语句包括
利用DDL语句生成器基于候选索引创建候选索引的DDL语句
通过DDL语句生成器读取候选索引中操作类型以及字段内容所述操作类型包括创建
修改及删除,通过DDL语句生成器输出相应的创建修改及删除索引的DDL语句
7 .根据权利要求5所述的一种分布式数据库推荐索引生成装置其特征是所述候选索
引生成模块计算统计信息包括
获取每个候选索引对应的所有访问模式
检查访问模式中目标谓词涉及的字段与当前的候选索引的字段的重合情况对于满足
重合条件的字段所对应的候选索引检查其访问模式是否存在实际过滤率若存在则使用
所述实际过滤率估算候选索引的统计信息
8.根据权利要求5所述的一种分布式数据库推荐索引生成装置其特征是所述索引验
证及优化模块在计算统计信息后验证候选索引包括
验证候选索引是否能够被SQL语句所使用
并针对提出候选索引所用的不健康语句使用候选索引后预估数据库收益变化是否能
够高于阈值
权 利 要 求 书
2/2
3
CN 116483831 B
3
of 10
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。