1 .一种基于规则的执行计划生成方法,其特征在于,所述执行计划生成方法包括:
获取待执行规则形成规则集合,确定所述规则集合中所有的谓词,其中,所述待执行规
则包括至少一个谓词;
根据待执行数据集,对所有的谓词进行评价,得到谓词评价结果,根据所述谓词评价结
果对所有的谓词进行排序,得到谓词排序结果;
根据所述谓词排序结果,对所述规则集合中所有待执行规则进行执行树构建,得到至
少一个执行树,其中,所述执行树包括一个根节点和至少一个叶节点,任两个节点之间的连
接边表征一个谓词,所述待执行规则对应所述执行树中依次连接的N个连接边,N为大于零
的整数;
根据所述待执行数据集,对所有执行树的每个连接边进行评价,得到边评价结果,根据
所述边评价结果,对每个执行树的节点的执行顺序进行排序,得到每个执行树对应的规则
执行计划。
2 .根据权利要求1所述的执行计划生成方法,其特征在于,所述根据待执行数据集,对
所有的谓词进行评价,得到谓词评价结果,包括:
获取待执行数据集,所述待执行数据集包括至少两个元组;
针对任一谓词,使用所述待执行数据集中任两个元组,计算执行所述谓词的评估时间,
遍历所述待执行数据集,得到总的评估时间;
获取所述谓词在所述待执行数据集中被满足的概率;
根据所述概率和总的评估时间,确定所述谓词的谓词评价结果,遍历所有谓词,得到每
个谓词的谓词评价结果。
3 .根据权利要求2所述的执行计划生成方法,其特征在于,所述使用所述待执行数据集
中任两个元组,计算执行所述谓词的评估时间,遍历所述待执行数据集,得到总的评估时
间,包括:
获取训练好的神经网络,其中,所述训练好的神经网络为使用与所述待执行数据集的
数据分布相同的数据集进行离线训练得到,其输入为两个元组和谓词,其输出为评估时间;
将所述待执行数据集中任两个元组和所述谓词输入所述神经网络,得到对应的评估时
间,遍历所述待执行数据集中所有元组,得到总的评估时间。
4 .根据权利要求2所述的执行计划生成方法,其特征在于,所述获取所述谓词在所述待
执行数据集中被满足的概率,包括:
获取所述谓词中的属性对象;
使用局部敏感哈希,将所有元组的所述属性对象对应属性值散列到k个桶中,确定每个
桶中的元组数,其中,k 为预定义参数,相似或相同的属性值以相对高的概率散列到同一个
桶中;
根据桶的个数和每个桶中元组数,对散列的均匀性进行计算,得到均匀性值为所述谓
词在所述待执行数据集中被满足的概率。
5 .根据权利要求3所述的执行计划生成方法,其特征在于,所述根据所述概率和总的评
估时间,确定所述谓词的谓词评价结果,包括:
将1与所述概率作差,得到概率差值;
将所述概率差值与所述总的评估时间做比,得到比值为所述谓词的谓词评价结果。
权 利 要 求 书
1/2 页
2
评论