南京基石数据有限责任公司
2
1 概述
IT 系统运维面临数字化转型的压力,因为随着信息系统的高速发展,系统规模与复杂
度都已经达到了前所未有的高度,传统的依靠专家与大量人力的运维模式无以为继。在这种
大背景下,寻求自动化、智能化运维来替代传统运维已经成为企业的必然选择。
不过完全基于数据分析的 AIOPS 算法虽然能从纷繁的数据中找出不一样的数据,但是
同样无法解读数据背后复杂的逻辑。因此 AIOPS 在 IT 运维的专业领域,比如数据库、中间
件等的运维自动化中能够落地的极少。D-SMART 大师问诊工具采用了一种特殊的 AIOPS 实现
理念,以知识自动化为核心构建 AIOPS 能力。与目前主流的 AIOPS 理念不同的是,大师问诊
的理论基础不是数据分析算法,而是运维大师们多年沉淀下来的运维经验。基于知识图谱和
知识推理,我们构建了大师问诊系统的基础框架。而大量的自动化分析工具与智能化算法的
引入,让大师的经验有了更大的用武之地。运维知识图谱、机器学习、深度学习的算法构成
的算法智能,形成了 D-SMART 大师问诊的双引擎。
充分利用专家经验,建立专家模型,并通过机器学习,人工智能构建运维自动化评估与
预测能力,可以借助专家经验训练出媲美专家的智能分析模型,大大减少运维工作对专家的
依赖,提高运维的效率。采用传统的运维方法,一个专家采集、分析一套系统的数据往往需
要花费数个小时,才能完成数据分析,并得出相关结论。
经过 4 年的耕耘,D-SMART 迎来了一个重大的更新,大家所关心的 V2.0 版本终于面世。
D-SMART V2.0 版本与之前的版本相比有着巨大的提升,这个提升主要在以下几个方面:
⚫ 全面支撑各种 IT 基础设施的运维,包括数据库、应用中间件、通讯中间件、集中
式存储、分布式存储等;
⚫ 自动化巡检工具的全覆盖,所有的运维对象的运维工具均和 ORACLE 数据库类似,
包括状态巡检功能也已经覆盖到所有的运维对象;
⚫ 性能与负载模型的全覆盖,所有运维对象均支持性能模型与负载模型;
⚫ 更多的工具支持,D-SMART 除了诊断分析外,对每类运维对象都提供了一系列常用
诊断分析工具;
⚫ 管理能力增强,D-SMART 2.0 除了为运维技术人员提供了大量的自动化工具外,还
为 IT 运维管理人员提供了更为丰富的报告,比如系统日检总结报告、系统运行周
报(按运维对象和按系统两种维度)、系统月度运行报告等;
⚫ 自动化诊断能力,在 D-SMART 2.0 企业版中,提供了更为强大的故障自动诊断工
评论