一种工作负载预测方法
技术领域
[0001]
本发明创造属于计算机技术领域,尤其是涉及一种工作负载预测方法。
背景技术
[0002]
工作负载预测的目标是使系统能够预测应用程序的在未来一段时间内的工作负
载在未来会是什么样子。因为实际应用程序的工作负载从来都不是静态的。然后,系统可以
根据此预测的工作负载选择要准备的优化,如提前建立索引等。
[0003]
需要指出的是,无人监督的工作负载预测具有挑战性。第一点在于是应用程序的
查询可能具有截然不同的到达率。因此,有效的预测模型必须能够识别和描述这些到达率
模式中的每一个。第二点是应用程序工作负载中查询的组成和数量会随着时间的推移而变
化。DBMS实现工作负载预测的能力在很大程度上取决于它对应用程序工作负载中的查询和
模式的了解。如果工作负载与过去的偏差太大,那么预测模型就会变得不准确,必须重新训
练。
[0004]
在实际中,工作负载常用的模式包含以下几种,有周期式、峰值式、渐变式等。其中
周期式体现在很多交互程序中,如公交乘车APP中,它们通过与人类交互获取数据,并因此
工作负载具有固定规律,在早上和下午的高峰时间出现较多查询。此类循环具有明显周期,
如24小时。另一种常见的工作负载模式是查询量随时间增加,但在最后几天内查询量疯狂
上涨,这种模式在具有特定截止日期的应用程序中十分典型。还有一种模式是工作负载随
时间逐渐演变。一般来讲这是用户发生变化和查询到达率模式发生变化,如增添新功能的
结果。同时准确预测以上几种模式的负载是有难度的,大部分工作都是集中在一到两种。
[0005]
以前的工作少有对工作负载进行建模,以往的工作更多侧重于对系统的资源需求
建模,而不是直接表示工作负载本身。它们更多关注CPU等资源的调度情况,而非数据库内
实际的查询模式。有一些方法通过回答有关 OLTP 工作负载变化的假设问题来模拟 DBMS
的性能,并以此将工作负载建模为具有固定比率的不同类型事务的混合体。还有一些工作
可以使用隐马尔可夫模型或回归模型来预测工作负载将如何随时间变化。还有的工作同时
结合了软硬件的优势,将查询聚合为固定模板,再将模板聚合为聚类,使用聚类预测查询效
果,这种方法在周期式工作中取得了不小的优势。
[0006]
早期的工作还使用具有预定义事务类型和到达率的更正式的方法对数据库工作
负载进行建模。所有这些方法都有不足之处,部分方法仅使用仅维护高级统计信息的有损
压缩方案,例如平均查询延迟和资源利用率。其他工作假设该工具提供了静态工作负载,或
者他们仅在工作负载发生变化时生成新模型,从而无法捕获查询量和工作负载。上述根据
模板进行聚类的方法同样有着对数据要求高(可聚类)、难训练(负载变化需要重新训练)等
缺点。
发明内容
[0007]
有鉴于此,本发明创造旨在提出一种工作负载预测方法,以解决现有工作负载预
说 明 书
1/6 页
3
相关文档
评论