1 .一种分布式数据库推荐索引生成方法,其特征是根据应用所在的数据库集群,获取
应用负载所含全部SQL语句所引用的数据对象及其关联的其他数据对象,筛选索引存在优
化空间的SQL语句作为不健康语句,从访问模式出发查找与不健康语句有关的谓词,并从所
述谓词中筛选出数据库运行性能与索引有关的目标谓词,根据目标谓词预设谓词优先级和
谓词组合规则,根据谓词优先级及谓词组合规则,获取多种字段组合,字段组合结合字段的
cardinality,获得候选索引,
根据候选索引创建候选索引的DDL语句,
根据候选索引对应的所有访问模式,检查访问模式中目标谓词涉及的字段与当前的候
选索引的字段的重合情况,对于满足重合条件的字段所对应的候选索引,计算其统计信息,
计算统计信息后验证候选索引,并将验证后候选索引、应用负载所含全部SQL语句所引
用的数据对象及其关联的其他数据对象发送至数据仓库,通过数据仓库反馈并推荐候选索
引给数据库节点。
2 .根据权利要求1所述的一种分布式数据库推荐索引生成方法,其特征是所述根据候
选索引创建候选索引的DDL语句,包括:
利用DDL语句生成器基于候选索引创建候选索引的DDL语句,
通过DDL语句生成器读取候选索引中操作类型以及字段内容,所述操作类型包括创建、
修改及删除,通过DDL语句生成器输出相应的创建、修改及删除索引的DDL语句。
3 .根据权利要求1所述的一种分布式数据库推荐索引生成方法,其特征是所述计算统
计信息,包括:
获取每个候选索引对应的所有访问模式,
检查访问模式中目标谓词涉及的字段与当前的候选索引的字段的重合情况,对于满足
重合条件的字段所对应的候选索引,检查其访问模式是否存在实际过滤率,若存在则使用
所述实际过滤率估算候选索引的统计信息。
4 .根据权利要求1所述的一种分布式数据库推荐索引生成方法,其特征是所述计算统
计信息后验证候选索引,包括:
验证候选索引是否能够被SQL语句所使用,
并针对提出候选索引所用的不健康语句,使用候选索引后预估数据库收益变化是否能
够高于阈值。
5 .一种分布式数据库推荐索引生成装置,其特征是包括数据收集模块、不健康语句分
析模块、候选索引生成模块和索引验证及优化模块,
数据收集模块根据应用所在的数据库集群,获取应用负载所含全部SQL语句所引用的
数据对象及其关联的其他数据对象,不健康语句分析模块筛选索引存在优化空间的SQL语
句作为不健康语句,候选索引生成模块从访问模式出发查找与不健康语句有关的谓词,并
从所述谓词中筛选出数据库运行性能与索引有关的目标谓词,根据目标谓词预设谓词优先
级和谓词组合规则,根据谓词优先级及谓词组合规则,获取多种字段组合,字段组合结合字
段的cardinality,获得候选索引,
候选索引生成模块根据候选索引创建候选索引的DDL语句,
候选索引生成模块根据候选索引对应的所有访问模式,检查访问模式中目标谓词涉及
的字段与当前的候选索引的字段的重合情况,对于满足重合条件的字段所对应的候选索
权 利 要 求 书
1/2 页
2
相关文档
评论