排行
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
中国数据库
向量数据库
时序数据库
实时数据库
搜索引擎
空间数据库
图数据库
数据仓库
大调查
2021年报告
2022年报告
年度数据库
2020年openGauss
2021年TiDB
2022年PolarDB
2023年OceanBase
首页
资讯
活动
大会
学习
课程中心
推荐优质内容、热门课程
学习路径
预设学习计划、达成学习目标
知识图谱
综合了解技术体系知识点
课程库
快速筛选、搜索相关课程
视频学习
专业视频分享技术知识
电子文档
快速搜索阅览技术文档
文档
问答
服务
智能助手小墨
关于数据库相关的问题,您都可以问我
数据库巡检平台
脚本采集百余项,在线智能分析总结
SQLRUN
在线数据库即时SQL运行平台
数据库实训平台
实操环境、开箱即用、一键连接
数据库管理服务
汇聚顶级数据库专家,具备多数据库运维能力
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
我的订单
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
资讯
活动
大会
课程
文档
排行
问答
我的订单
首页
专家团队
智能助手
在线工具
SQLRUN
在线数据库即时SQL运行平台
数据库在线实训平台
实操环境、开箱即用、一键连接
AWR分析
上传AWR报告,查看分析结果
SQL格式化
快速格式化绝大多数SQL语句
SQL审核
审核编写规范,提升执行效率
PLSQL解密
解密超4000字符的PL/SQL语句
OraC函数
查询Oracle C 函数的详细描述
智能助手小墨
关于数据库相关的问题,您都可以问我
精选案例
新闻资讯
云市场
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
专家团队
智能助手
精选案例
新闻资讯
云市场
微信扫码
复制链接
新浪微博
分享数说
采集到收藏夹
分享到数说
首页
/
AIOPS需要更精准的数据
AIOPS需要更精准的数据
白鳝的洞穴
2025-04-14
24
前两年我们在与一个用户交流数据库运维平台需要丰富而准确的指标的时候,他们认为我们的观点不对。他们以往的经验是有多大的锅煮多少人的菜,利用现有能采集到的指标去做好数据库运维监控就够用了,没必要采集过多的指标。因此他们坚持使用zabbix采集的那二十多个指标来辅助日常运维。在驻场DBA的支撑下,虽然偶然出些小故障,不过总体还算过得去。最近上级部门要他们利用AI来解决一些一些运维的问题,于是他们搭了个满血DeepSeek环境,利用他们现有的Zabbix环境采集的数据进行了一些尝试,发现效果很差。
其实DBAIOPS团队在研究如何利用大模型解决数据库运维中的问题的时候,也是越发觉得精准的数据的重要性。虽然目前DBAIOPS对数据库和操作系统采集了数百个指标,不过在实际使用过程中依然觉得不太够用。
比如严重的系统换页会引起事务平均等待时间变长,间接导致事务阻塞数量增大。为了确定该影响是否存在,我们要如何分析呢?目前DBAIOPS系统中有内存使用率,内存不可用率和交换区使用率这三个指标。内存使用率指标是绝对没啥用的,因为内存使用率过高,很可能大部分内存在BUFFER/CACHE中,不一定会引发换页,因此虽然会对应用产生影响,不过影响极小。内存不可用率准确一些,因为占用的内存无法快速释放,因此引发换页的几率更高一些。SWAP使用率只能说明当前部分内存换页了,但是还是无法明确表示在分析这段时间内产生过严重换页,因为很可能SWAP是很久以前就有的。
如果我们只是把这几个指标输入给DeepSeek,那么DeepSeek就只能去推测,产生幻觉就不可避免了。解决这个问题的方法就需要增加一个新的指标,最好的指标是通过/proc/vmstat去采集并记录换页的数据,并计算出采集周期内的差值,形成指标。如果当前系统并没有采集这方面的数据,也可以根据swap使用率的变化来做判断。不过这个变化是不准确的,如果某个时间区间内先增加了10%的SWAP,又减少了10%的SWAP,那么在两个指标采集点上看到的可能是想通的值。
从今天的这个问题,我们再一次认识到数字化对于智能化的重要意义。想做智能化,还是先老老实实把数字化搞好吧。
大数据
aiops
文章转载自
白鳝的洞穴
,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
热门文章
简单分析下GOLDENDB
2022-08-24
17359浏览
BBW的一些典型场景
2020-09-30
12099浏览
数据库的IO性能分析常见路径
2021-03-11
8962浏览
队列深度对IO性能的影响
2021-01-09
8494浏览
用Benchmark压测PostgreSQL测试
2020-06-18
8445浏览
领墨值
有奖问卷
意见反馈
客服小墨