暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GaussDB发展历史概述

openGauss小助手 2021-10-22
2967

华为公司研究数据库是从满足生产实践出发,从研发用于满足局限场景的较简单架构数据库产品开始,逐步向通用性、可规模商用的数据库产品演进,到2019年终于正式发布面向企业客户场景的通用分布式数据库产品。其发展历史如图5-1所示。

图5-1 GaussDB发展历程图

1.华为自研数据库的早期发展阶段

华为公司研究和开发数据库技术及产品,最早可追溯到2001年。当时,华为公司中央研究院Dopra团队为了支撑华为所生产的电信产品(交换机、路由器等),启动了内存数据存储组件DopraDB的研发,从此开启了华为自研数据库的历程。DopraDB后来随着业务和组织的切换,成为华为高斯数据库团队的GMDB V1系列产品。

2005年,华为电信软件公司在开发电信计费软件系统BOSS(Business and Operation Support System,业务运营支撑系统)时,评估了当时最高性能的内存数据库软件,发现其性能和特性无法满足业务诉求,便启动了SMDB(Simple Memory DataBase)的开发。SMDB在当时以超高性能完成了产品设计规格,支撑了华为电信计费软件BOSS系统的成功上市,并成为业界BOSS软件TOP 5的厂商。

2008年,华为核心网产品线需要在产品中使用一款轻量级、小型化的磁盘数据库,于是华为基于PostgreSQL开源数据库开发ProtonDB,这是华为与开源数据库PostgreSQL的第一次亲密接触。

2. GaussDB的诞生和发展阶段

2011年,“数字洪水即将到来”,华为铸造“方舟”应对,从此组建了2012实验室。华为公司认为在数字洪水时代,ICT(Information and Communications Technology,信息和通信技术)软件技术栈中数据库是不可缺少的关键技术,因此将原来分散在各个产品线的数据库团队及业务重新组合,在2012实验室中央软件院下成立了高斯部,负责华为公司数据库产品和技术的研发。高斯部得名于纪念大数学家高斯(Gauss)。

高斯部的数据库产品研发历史按照场景和产品特点可分为三个系列:

  1. GMDB内存数据库;
  2. GaussDB 100 OLTP数据库;
  3. GaussDB 200 OLAP数据库。

3.数据库产业化阶段

随着华为高斯数据库在2019年对业界正式发布,华为自研数据库进入了第三阶段,即数据库产业化阶段。华为高斯数据库后续的规划主要将围绕如下方面展开。

1) 数据库生态

作为一款通用性、规模商用的数据库产品,生态是重中之重,华为将围绕两个方向来解决数据库生态问题。

(1)技术上采取云化+自动化方案。通过数据库运行基础设施的云化将DBA(数据库管理员)和运维人员的日常工作自动化,解决如补丁、升级、故障检测及修复等工作带来的开销。传统数据库随着业务负载变化越跑越慢的问题,依赖DBA监控和优化来解决。而通过在数据库内部引入AI算法,实现免DBA自动数据优化,将进一步降低对人工的依赖。

(2)商业上开展与数据库周边生态伙伴的对接与认证,解决开发者/DBA难获取、应用难对接等生态难题,减少企业客户使用华为高斯数据库面临的后顾之忧。

数据库产业生态全景如图5-2所示。

图5-2 数据库产业生态全景

2) 技术竞争力。

数据库作为“软件皇冠上的明珠”,其技术含量十分高,因此要想在市场上击败竞争对手,必须持之以恒地在关键技术上进行大规模投资。华为高斯数据库将在如下方向构筑竞争力。

(1)分布式。构筑世界领先的分布式事务能力和跨DC(Data Center,数据中心)高可用能力,解决传统关系型数据库的扩展性、可用性不足等瓶颈。

(2)云化架构。未来10年云数据库将成为市场主流,华为高斯数据库需要构筑满足公有云、私有云和混合云场景的云化架构,满足各种企业场景的云数据库诉求。

(3)混合负载。过去由于数据库性能不足,架构缺乏隔离性,一个数据库实例难以在满足SLA(Service Level Agreement,服务级别协议)前提下,同时支撑不同业务负载(交易型、分析型)的运行。随着硬件性能的提升和新数据架构理论的创新,在一套数据库中运行多种负载已经成为行业趋势,这不但简化了系统部署、消除了数据复制或搬迁带来的数据一致性问题,同时也提升了系统的可靠性和实时性。

(4)多模异构。传统数据库围绕关系型数据进行管理,随着移动互联网、IoT(Internet of Things,物联网)、人工智能的普及应用,(时序、Graph图、图像等)新类型数据成为接下来十年数据库系统主要的管理类型,这需要支持多模数据管理的新型数据库。通用处理器随着晶体管制程逐步走到极限,而异构加速器(FPGA/GPU/NPU等)大放异彩,在AI(人工智能)等场景大量使用,如何通过改造优化数据库架构,实现充分利用通“用处理器+异构加速器”算力优势,是高斯数据库重点发展方向之一。

(5)AI+DB。2010年起随着大数据量和大计算量的普及,AI算法精度和适用范围足以支撑在特定场景(如数据库参数调优、SQL执行优化等)下解决问题;另一方面,随着深度神经网络的普及化,对过去无法有效处理的图像、语音、文本等非结构化数据,已经能很好地从中抽取结构化信息,如何将其用在数据库中解决非结构化数据的高效管理也成为当前研究的热点。

华为GaussDB力争在5~10年内竞争力水平进入世界第一梯队,与Oracle、微软、AWS等厂商同台竞技。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论