很荣幸能够参加由Guass松鼠会、openGauss和墨天轮联合举办的第2期《openGauss训练营》。近些年,在国家的政策引导下,社会各界大力支持国产数据库在安全、可靠、自研方向的飞速发展。华为的openGauss目前在“墨天轮国产数据库流行度排行”榜上算是长期占领TOP10的位置。以前只知道华为有一款数据库叫GaussDB,从2020.6.30开始,华为宣布openGauss正式开源,当时挺纳闷难道开源就只是改了个名称。后来通过一些相关的报道逐步了解了openGauss和GaussDB是属于2款定位不同的数据库产品,openGauss是在GaussDB的基础架构上进一步优化调整,将原本的分布式产品,变为可以在单机上也能运行,这也是两者的最大不同。openGauss可以理解为是一款传统的关系型数据库,它可以兼容Oracle、MySQL、PostgreSQL的绝大多数特性,包括SQL的写法更类似于PostgreSQL;而GaussDB则不同,它是云原生的分布式架构,也就是近期很流行的分布式数据库。至于两者的优劣,这里就不展开评论。在我看来,无论是集中式或分布式,可谓各有优势,最关键是看应用系统的场景和其所处的软硬件环境。
其次,参加此次的培训下来,给我的感受还是收获颇丰的。各位在不同领域都是大佬的讲师,从多个方面给我们这批学员讲解了包括openGauss的总体架构,安装部署、运维监控等13个方向的主题分享,其中让我印象深刻的2个课程当属《内存优化表》和《openGauss的AI特性》。openGauss是一款单进程多线程的数据库,这点与PostgreSQL不同,个人猜测是为了能更好地利用并发提高性能。在存储引擎方面现在已能够支持,MVCC行存、列存、内存MOT。这里的内存MOT是3种里面性能最强大的,高吞吐量:3倍于磁盘表,6倍于PG 12.2;低延迟:事务加速3倍至5.5倍,可谓很是惊人。当然其也有一些缺陷,就是openGauss中启用了增量检查点,则无法创建MOT表。这个感觉还是需要后面做好调整,毕竟增量检查点对于任何一种数据库来说都是保证磁盘IO平滑的基础。再说到AI方面,openGauss DB4AI有以下几大特点:自动特征工程、模型最优选择、超参数优化、优化算法选择、支持深度学习、模型管理。这6方面不论是其中哪项,都很是诱人,其极大地缩减了DBA、运维人员、开发人员对于数据库的学习成本。当一款数据库真正能做到以上这些,可以说是极其优秀了。
最后,总结一下openGauss的核心技术。
1、在CPU NUMA多核的硬件发展趋势下,openGauss通过线程绑核,NUMA化数据结构改造,数据分区和原子指令优化实现150Wtpmc。
2、企业可用性指标为RPO和RTO,openGauss支持双机同步保证RPO=0,通过极致RTO技术保证RTO<10s。
3、企业的性能指标为吞吐量和时延,openGauss通过服务器线程池支持企业的高并发,通过增量检查点保证IO性能的稳定性。
4、企业的业务场景为OLTP和OLAP,openGauss通过行列混合引擎同时支持行存和列存,适应企业混合场景。
5、在风控,计费等极端性能企业场景下,openGauss通过免锁内存表,内存索引算法保证高吞吐,低时延,满足企业场景要求。
6、在云化的发展趋势下,openGauss通过全密态实现端到端加密,解决企业上云安全顾虑。
7、通过DB4AI和AI4DB,实现openGauss自运维和调优,减少企业应用开发和维护的TCO。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。