暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

openGauss训练营学习心得

原创 向前龙 2021-09-13
693

9月11、12号有幸参加了opengauss的8小时集训,下面是我摘录的一些内容:

openGauss数据库是一款由华为主导、各个生态合作伙伴共同建设的开源关系型数据库管理系统,开源发行协议遵从木兰宽松许可证v2。
openGauss数据库源于PostgreSQL-XC项目,内核源于Postgres 9.2.4,总代码量约120W行,其中内核代码约95W行。华为结合企业级场景需求,深度融合其在数据库领域多年的经验,新增或修改了内核代码约70W行,内核代码修改比例约占总内核代码量的74%。保留了原先PostgreSQL的接口和公共函数代码(约25W行),仅对这些代码做了适当优化,这样也使得openGauss与现有的PG生态兼容性较好。
总体而言,华为主导的openGauss开源项目着重在数据库架构、事务管理、存储引擎、SQL优化器、以及鲲鹏芯片做了大量优化,以实现其企业级关键价值特性:高性能、高安全、易运维、全开放。
第一次听说openGauss的小伙伴本能反应可能是:什么国产数据库? 那都是外国人的事情!openGauss应该算是PostgreSQL的增强版。
“数据库是外国人的事情” 这个观点适合20年前;当武汉达梦、人大金仓、南大通用、神舟通用等传统国产数据库兴起的时候,这个观点应该改为“数据库是中国人可以搞的事情”;2020年11月,PingCAP宣布完成D轮融资2.7亿美元,创造了全球数据库历史新的里程碑,其分布式开源数据库TiDB目前在国产数据库中排名第一位。同月,阿里宣布山东移动核心系统正式上跑“OceanBase”,使得用户处理效率提升30%,数据容量由7TB压缩为0.7TB,存储投入成本降低90%,同时,凭借着OceanBase、PolarDB、AnalyticDB等数据库,稳居Gartner魔力四象限的领导者地位。同时,华为的GaussDB和腾讯的TDSQL等数据库也均入选Gartner魔力四象限。这些都是国产数据库的突破,标志着国产数据库已经得到了国际认可。随着诸多国产数据库的新闻报道,我们看到了一个又一个国产数据库入驻核心行业(互联网、金融、电力、政府等等)的案例,国产数据库已进入百花齐放的时代,“数据库这件事中国人做没有问题”,而且从当前行业发展趋势看,我国的数据库技术正在朝着分布式、云化、以及国产化的道路快速发展,AI4DB、数据库自治等技术也将得到广泛应用,相信在不久的将来,面对数据库的应用场景,国产数据库可以和“外国人”的数据库有相同的话语权。
那么,关于openGauss,个人认为用“PG增强版”这个概念替代很不合适。数据库内核是数据库的核心所在,openGauss的内核修改量高达74%,这基本上可以算是“脱胎换骨”般的改造,并且从根本上解决了部分PG原生架构所带来的缺陷(如,事务ID回卷等)。由于PG的公共函数和接口部分代码做了保留,我们在openGauss里面能看到PG的影子很正常,但核心技术和发展规划与PG有很大不同,否则当初就合并到PG社区了。
openGauss数据库于2020年6月30日对外宣布开源,本人也是在7月份开始接触openGauss数据库相关资料。作为DBA出身的IT民工(本来想说是IT工匠,结果发现还不够格,嘿嘿…),本能的想先看看数据库的架构介绍,通过架构可以很好的了解数据库的组成模块及相关技术原理,对熟悉openGauss数据库有很大帮助,毕竟一个能随心所欲“拆解”数据库的人才是一个优秀的数据库工程师嘛。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论