暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种工作负载预测方法_CN117390465B_南大通用.pdf
31
11页
0次
2024-06-11
免费下载
(19)国家知识产权局
(12)发明专利
(10)授权公告号
(45)授权公告日
(21)申请号 202311686615 .X
(22)申请日 2023 .12.11
(65)同一申请的已公布的文献号
申请公布号 CN 117390465 A
(43)申请公布日 2024 .01 .12
(73)专利权人 天津南大通用数据技术股份有限
公司
地址 300384 天津市滨海新区华苑产业区
海泰发展六道6号海泰绿色产业基地J
(72)发明人 路亚彬 任景彪 李晨光 赵伟 
(74)专利代理机构 天津企兴智财知识产权代理
有限公司 12226
专利代理师 石倩倩
(51)Int.Cl .
G06F
18/22
(2023 .01)
G06F
16/2455
(2019 .01)
G06F
18/214
(2023 .01)
G06F
18/24
(2023 .01)
G06F
18/27
(2023 .01)
(56)对比文件
KR 20220126468 A ,2022 .09.16
WO 2023007704 A1 ,2023.02 .02
CN 114221877 A ,2022.03 .22
US 2014214880 A1 ,2014 .07 .31
CN 116720742 A ,2023.09 .08
US 2022341996 A1 ,2022 .10.27
杨殿生 .基于ACO-BPNN的话务量预测模型 .
激光杂志.2015,(04) ,全文 .
徐耀松;段彦强;王雨虹;屠乃威 .基于相似
日选择与改进Stacking集成学习的短期负荷预
.传感技术学报.2020,(04) ,全文.
夏慧明;王志刚;吴金林.灰色系统非线性回
归电力负荷预测.科学技术与工程 .2012 ,(23) ,
全文.
审查员 王佳楠
(54)发明名称
一种工作负载预测方法
(57)摘要
本发明创造提供了一种工作负载预测方法
该方法包括以下步骤获取当前的负载信息
当前的负载信息输入预先训练的预测模型所述
预测模型包括线性模型和非线性模型计算非线
性模型与线性模型的预测结果的比值若比值大
于指定的比例阈值则输出非线性模型的预测结
果;反之则输出线性模型的预测结果本发明创
造中在周期式峰值式渐变式等多种工作负载
预测中均能够获得精确度较高的预测结果且该
预测方法中未采用额外的神经网络架构训练时
间更短训练成本更低
权利要求书1页 说明书6页 附图3页
CN 117390465 B
2024.02.20
CN 117390465 B
1 .一种工作负载预测方法其特征在于包括以下步骤
获取当前的负载信息
将当前的负载信息输入预先训练的预测模型所述预测模型包括线性模型和非线性模
型;
计算非线性模型与线性模型的预测结果的比值若比值大于指定的比例阈值则输出
非线性模型的预测结果反之,则输出线性模型的预测结果
所述预测模型的训练方法包括
对已有工作负载进行预处理将具有某一格式的查询操作统一抽象为查询模板
将多个所述查询模板的条件列输入频繁项集挖掘算法中由频繁项集挖掘算法筛选出
出现频率超过给定阈值的频繁项查询模板
由频繁项查询模板所代表的目标查询操作构建新集群将所述新集群作为训练样本输
入所述预测模型
2 .根据权利要求1所述的工作负载预测方法其特征在于所述由频繁项查询模板所代
表的目标查询操作构建新集群的方法包括
对已有工作负载进行剪枝去除目标查询操作之外的查询操作
将所述目标查询操作按照所述频繁项查询模板进行分类
将分类后的所述目标查询操作按照所述频繁项查询模板的顺序拼接构成所述新集群
3 .根据权利要求2所述的工作负载预测方法其特征在于所述预测模型的训练方法包
括:
将所述新集群按照所述频繁项查询模板的顺序进行剪切同时预测多个所述频繁项查
询模板的到达率
4 .根据权利要求1所述的工作负载预测方法其特征在于所述线性模型为XGboost
型;所述非线性模型为KRkernel模型
5 .一种电子设备包括处理器以及与处理器通信连接且用于存储所述处理器可执行
指令的存储器其特征在于所述处理器用于执行上述权利要求14任一所述的工作负载预
测方法
6 .一种服务器其特征在于包括至少一个处理器以及与所述处理器通信连接的存储
器,所述存储器存储有可被所述至少一个处理器执行的指令所述指令被所述处理器执行
以使所述至少一个处理器执行如权利要求14任一所述的工作负载预测方法
7 .一种计算机可读取存储介质存储有计算机程序其特征在于所述计算机程序被处
理器执行时实现权利要求14任一项所述的工作负载预测方法
权 利 要 求 书
1/1
2
CN 117390465 B
2
一种工作负载预测方法
技术领域
[0001]
本发明创造属于计算机技术领域尤其是涉及一种工作负载预测方法
背景技术
[0002]
工作负载预测的目标是使系统能够预测应用程序的在未来一段时间内的工作负
载在未来会是什么样子因为实际应用程序的工作负载从来都不是静态的然后系统可以
根据此预测的工作负载选择要准备的优化如提前建立索引等
[0003]
需要指出的是无人监督的工作负载预测具有挑战性第一点在于是应用程序的
查询可能具有截然不同的到达率因此有效的预测模型必须能够识别和描述这些到达率
模式中的每一个第二点是应用程序工作负载中查询的组成和数量会随着时间的推移而变
DBMS实现工作负载预测的能力在很大程度上取决于它对应用程序工作负载中的查询和
模式的了解如果工作负载与过去的偏差太大那么预测模型就会变得不准确必须重新训
[0004]
在实际中工作负载常用的模式包含以下几种有周期式峰值式渐变式等其中
周期式体现在很多交互程序中如公交乘车APP中,它们通过与人类交互获取数据并因此
工作负载具有固定规律在早上和下午的高峰时间出现较多查询此类循环具有明显周期
24小时另一种常见的工作负载模式是查询量随时间增加但在最后几天内查询量疯狂
上涨这种模式在具有特定截止日期的应用程序中十分典型还有一种模式是工作负载随
时间逐渐演变一般来讲这是用户发生变化和查询到达率模式发生变化如增添新功能的
结果同时准确预测以上几种模式的负载是有难度的大部分工作都是集中在一到两种
[0005]
以前的工作少有对工作负载进行建模以往的工作更多侧重于对系统的资源需求
建模而不是直接表示工作负载本身它们更多关注CPU等资源的调度情况而非数据库内
实际的查询模式有一些方法通过回答有关 OLTP 工作负载变化的假设问题来模拟 DBMS
的性能并以此将工作负载建模为具有固定比率的不同类型事务的混合体还有一些工作
可以使用隐马尔可夫模型或回归模型来预测工作负载将如何随时间变化还有的工作同时
结合了软硬件的优势将查询聚合为固定模板再将模板聚合为聚类使用聚类预测查询效
果,这种方法在周期式工作中取得了不小的优势
[0006]
早期的工作还使用具有预定义事务类型和到达率的更正式的方法对数据库工作
负载进行建模所有这些方法都有不足之处部分方法仅使用仅维护高级统计信息的有损
压缩方案例如平均查询延迟和资源利用率其他工作假设该工具提供了静态工作负载
者他们仅在工作负载发生变化时生成新模型从而无法捕获查询量和工作负载上述根据
模板进行聚类的方法同样有着对数据要求高可聚类难训练负载变化需要重新训练
缺点
发明内容
[0007]
有鉴于此本发明创造旨在提出一种工作负载预测方法以解决现有工作负载预
说 明 书
1/6
3
CN 117390465 B
3
of 11
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。