暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DEEPSEEK解决了数据库智能运维中的哪些问题

白鳝的洞穴 2025-03-03
70
DeepSeek的出现让做智能运维的朋友们像打了鸡血一样,最近在IT比较发达的城市的咖啡厅里,DeepSeek是被说得最多的词汇。DeepSeek能解决智能运维中的哪些问题,哪些问题无法依靠DeepSeek来解决呢?今天的这篇文章来谈谈DBAIOPS社区的小伙伴们对此的看法。
首先,DeepSeek的出现肯定是颠覆性的,其开源特性决定了应用前景十分广阔。其技术特性就更令人兴奋了,强大的推理能力、低廉的推理成本都助推了DeepSeek行业应用的快速落地。大量的蒸馏后的小模型让部署成本更低,中小企业在一些安全性要求较高的离线环境下使用成本也大大降低了。我想不远的未来,在一些安全要求较高、联网条件不是太好的边缘侧、场站侧的应用落地也会大规模出现了。
DeepSeek应用场景很广,使用成本较低,这一点已经是大家的共识了。不过很多人使用了DeepSeek之后发现大语言模型的幻觉依然存在,DeepSeek依然不是特别靠谱。确实如此,哪怕人类专家,对于自己没见过的问题还无法正确回答,更别说一个不具备真正人类智慧的数学为基础的大模型了。DeepSeek不是万能的,并不是说只要把满血版的大模型部署上,就可以直接跑步进入共产主义社会了。DeepSeek只是一个基础的能力底座,而不是上帝。哪怕你用DeepSeek做知识问答,也不是仅仅喂进去大量的资料就能够完成的。
知识工程依然重要,在ChatGPT火热的时代,提示工程是获得高质量的应用落地的关键,在DeepSeek火热的时代,因为DS具有的强大的推理能力,让提示变得更加简单了,但是知识工程在DS应用落地时更加重要了。DS强大的推理能力需要精准的基础知识和数据作为支撑,大家可能已经意识到了,当ZERO SHOT出现的时候,大模型的幻觉十分明显,要想控制住产品的质量,尽可能消除ZERO SHOT是十分关键的,给DS准确的知识和数据是获得准确答案的关键。
仅有知识是无法解决生产现场的问题的,那样的话只能把DS当成知识问答的工具。而把数据和知识紧密结合,则可以直达生产一线,直接让DS帮我们解决以往AIOPS无法解决的很多问题。

DBAIOPS社区使用社区版DBAIOPS工具采集的数据,辅助一知衍KYD平台中的知识图谱,在一台PC机上安装了一块二手的RTX 3090显卡,整机成本不到1万块,搭建了一个DS的应用环境。在一个本地化部署的32b千问蒸馏模型上尝试了针对Oracle数据库的故障模型诊断和SQL优化两个场景。
从应用效果来看,通过知识图谱中的精准的知识加上DBAIOPS中丰富而准确的数据加持,32B的蒸馏模型也能够表现出令人满意的推理效果。通过不断优化知识图谱,DS的推理结果甚至超出人类专家的水准,而且稳定性很好,同样的故障场景的多次推理,虽然输出的内容格式,文字内容有差异,但是问题发现和最后的建议都是稳定的。
在SQL优化上,刚开始的时候DBAIOPS社区发现满血版的DS做SQL优化效果很好,但是在32B上无法复现满血版的能力。不过经过知识工程不断优化知识图谱,经过数天的努力后,在32B环境中,也我们也看到了类似满血DS的效果,稳定性也达到了预期。从这里我们有所体会,只要大模型本身的知识+诊断工具推送给DS的背景知识覆盖了场景推理所需要的所有知识,并且DS能够准确获得推理所需要的必要数据,那么推理的结果必然是稳定的。知识工程就需要向着这个方向前进。当然如果能够基于DS满血版蒸馏出更高质量的领域大模型来,对于AIOPS在数据库领域的低成本落地肯定是更有帮助的。不过这种成本较高的基础工作由谁来做,目前还不好说,数据库厂商愿意投资去做这些事情吗?
不管如何,DS的出现,让数据库智能化运维的真正落地有了强大的平台,下一步就看大家如何踏踏实实地去落地应用场景了。希望更多的数据库智能运维场景尽快落地,也希望DBAIOPS的探索能给大家带来一些启发。


文章转载自白鳝的洞穴,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论