openGauss训练营学习心得

原创 Mevi 2021-09-13

752

很荣幸能够参加由Guass松鼠会、openGauss和墨天轮联合举办的第2期《openGauss训练营》。近些年，在国家的政策引导下，社会各界大力支持国产数据库在安全、可靠、自研方向的飞速发展。华为的openGauss目前在“墨天轮国产数据库流行度排行”榜上算是长期占领TOP10的位置。以前只知道华为有一款数据库叫GaussDB，从2020.6.30开始，华为宣布openGauss正式开源，当时挺纳闷难道开源就只是改了个名称。后来通过一些相关的报道逐步了解了openGauss和GaussDB是属于2款定位不同的数据库产品，openGauss是在GaussDB的基础架构上进一步优化调整，将原本的分布式产品，变为可以在单机上也能运行，这也是两者的最大不同。openGauss可以理解为是一款传统的关系型数据库，它可以兼容Oracle、MySQL、PostgreSQL的绝大多数特性，包括SQL的写法更类似于PostgreSQL；而GaussDB则不同，它是云原生的分布式架构，也就是近期很流行的分布式数据库。至于两者的优劣，这里就不展开评论。在我看来，无论是集中式或分布式，可谓各有优势，最关键是看应用系统的场景和其所处的软硬件环境。
其次，参加此次的培训下来，给我的感受还是收获颇丰的。各位在不同领域都是大佬的讲师，从多个方面给我们这批学员讲解了包括openGauss的总体架构，安装部署、运维监控等13个方向的主题分享，其中让我印象深刻的2个课程当属《内存优化表》和《openGauss的AI特性》。openGauss是一款单进程多线程的数据库，这点与PostgreSQL不同，个人猜测是为了能更好地利用并发提高性能。在存储引擎方面现在已能够支持，MVCC行存、列存、内存MOT。这里的内存MOT是3种里面性能最强大的，高吞吐量：3倍于磁盘表，6倍于PG 12.2；低延迟：事务加速3倍至5.5倍，可谓很是惊人。当然其也有一些缺陷，就是openGauss中启用了增量检查点，则无法创建MOT表。这个感觉还是需要后面做好调整，毕竟增量检查点对于任何一种数据库来说都是保证磁盘IO平滑的基础。再说到AI方面，openGauss DB4AI有以下几大特点：自动特征工程、模型最优选择、超参数优化、优化算法选择、支持深度学习、模型管理。这6方面不论是其中哪项，都很是诱人，其极大地缩减了DBA、运维人员、开发人员对于数据库的学习成本。当一款数据库真正能做到以上这些，可以说是极其优秀了。
最后，总结一下openGauss的核心技术。
1、在CPU NUMA多核的硬件发展趋势下，openGauss通过线程绑核，NUMA化数据结构改造，数据分区和原子指令优化实现150Wtpmc。
2、企业可用性指标为RPO和RTO，openGauss支持双机同步保证RPO=0，通过极致RTO技术保证RTO<10s。
3、企业的性能指标为吞吐量和时延，openGauss通过服务器线程池支持企业的高并发，通过增量检查点保证IO性能的稳定性。
4、企业的业务场景为OLTP和OLAP，openGauss通过行列混合引擎同时支持行存和列存，适应企业混合场景。
5、在风控，计费等极端性能企业场景下，openGauss通过免锁内存表，内存索引算法保证高吞吐，低时延，满足企业场景要求。
6、在云化的发展趋势下，openGauss通过全密态实现端到端加密，解决企业上云安全顾虑。
7、通过DB4AI和AI4DB，实现openGauss自运维和调优，减少企业应用开发和维护的TCO。

opengauss opengauss训练营

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者