暂无图片
暂无图片
15
暂无图片
暂无图片
7
暂无图片

【专家有话说第一期】行业应用激增,国产数据库学习路在何方?

原创 墨天轮编辑部 2024-08-14
1419

前言:墨天轮社区一直致力于推动数据库技术的发展和应用,为广大从业者和爱好者提供一个学习、交流和分享的平台。自2023年正式推出了墨天轮社区“特约作者”专家团栏目,至今已汇聚来自不同领域的专家二十余位、共发布行业深度解读文章二十余篇,为大家带来了深刻的行业发展解读洞察与切实的个人职业发展建议。

为了呈现更加多元化、前瞻性的观点与见解,现将在专家团中发起 【专家有话说】系列专栏,每期邀请多位专家针对一个数据库行业发展及职业成长相关的核心问题进行深入探讨,汇聚智慧、碰撞思想、博采众长。

当前,国产数据库在众多行业中得到了广泛应用,从金融、政务到互联网、制造业等均持续深入拓展。随着国产数据库的应用场景日益丰富,对相关技术人才的需求与日俱增,学习国产数据库的需求便越来越多。然而,面对众多的国产数据库产品,很多学习者都会感到迷茫,不知道该如何选择、也不清楚从何开始系统学习。

第一期【专家有话说】系列专栏则将围绕:学习国产数据库该怎么选、怎么学 展开。我们邀请到了经验丰富的数据库专家分享自己的建议,包含但不限于选择依据、推荐产品、学习方法、学习资源等,望能为大家掌握国产数据库、提升技术能力带来参考。

🎙️韩锋

副本_活动倒计时创意文字风公众号首图__2024081415_43_14.png

1、如何选?

国产数据库繁多,初学者会存在选择困难,这里给出一些选择原则,供大家参考。

(1)分清场景类别
首先需要分清业务场景及对应的数据库类别。这其中的类别很宽泛,既可以包括数据模型(关系、图、时序、向量等),也可以包括物理架构(集中式、分布式等),还包括兼容属性(MySQL、PostgreSQL等)。

(2)行业头部优先
其次在选择除了技术因素等外,要充分考虑行业特性。不同行业对数据库的要求是有所差异的,可优先行业头部的数据库厂商。一方面是因为这些厂商产品针对行业的适用性更高,另一方面也说明厂商的服务支持等方面做的不错。

(3)自测评估次之
第三的选择上要充分结合自身特点,有针对性的做功能、性能、高可用的测试。可参考一些评测报告等,但更好的还需自己亲自来测。

(4)生态开放第三
最后是生态考虑,充分开放的生态有利于用户进行学习管理与适配等。

2、如何学?

学习国产数据库,跟之前学习数据库没有大的区别,这里有以下几个建议。

(1)充分利用厂商资源,不少厂商都推出了认证课程,很多还是免费的,可以利用起来。

(2)从官网文档入手,相对于开源或国外商业数据库,大部分国产数据库的资料很少,比较好的切入点就是官方文档。

(3)参与到生态圈中,不少产品也都提供了论坛、用户组等,也可充分利用起来,提问题找答案。

🎙️冯若航

副本_活动倒计时创意文字风公众号首图__2024081415_37_21.png

国产数据库的竞争,其实本质上是 PostgreSQL / MySQL 生态内部的竞争。从纯技术的角度讲,一个国产数据库能打与否,取决于其 “含P量” —— 含有 PostgreSQL 内核的纯度与版本新鲜度。版本越新,魔改越少,附加值越高,使用价值就越高,也就越能打。其次要看它是否在 PostgreSQL 基础上提供了帕累托改进。

我建议用户选择供应商锁定程度最小的产品,也就是纯开源的 PostgreSQL,并采购 PostgreSQL 数据库服务,而不是“国产数据库”。如果非要在 “国产数据库” 中选择,请记住含 P 量这个黄金标准。

学习国产数据库本质上就是学习 PostgreSQL,请认准 PG 官方文档,建议通过 Pigsty 搭建生产仿真环境 RDS 动手实践。

🎙️陈举超

副本_活动倒计时创意文字风公众号首图__2024081416_07_46.png
1、个人选择哪家国产数据库学习,可以考虑以下几点:

(1)公司已经在使用的国产数据库,个人认为这是优先级别最高的,哪怕非常小众,也要花更多精力去学习,不能完全依赖厂商,要体现自己的价值。

(2)如果只是想提升自己国产数据库水平,建议选择热门、客户案例多、公司有一定规模的国产数据库,比如达梦、OB、TiDB等,这些数据库的热门程度,在招聘网站上都有体现,也可以参考墨天轮排行榜。

2、如何学习国产数据库

国产数据库的学习,如果是自学,一定是先从官方文档开始,申请测试安装介质,熟悉体系结构、安装部署、备份恢复、性能优化、迁移等,当然你很有可能卡在第一步,你要学习的国产数据库没有官方文档,或者官方文档不全,这是常有的事,所以学习国产数据库第一步是放平心态,别总盯着缺点,期望越大失望越大。因为国产数据库天生带有替换的使命,大多会和某款国外数据库十分相似,比如Oracle、MySQL、PostgreSQL。建议在学习时多进行对比,找出差异,不要完全按照MOP数据库(指MySQL、Oracle和PostgreSQL三种数据库)的运维经验去维护国产数据库,多思考、多测试,如果有精力还是要加强MOP的学习。

🎙️沈封

副本_活动倒计时创意文字风公众号首图__2024081416_28_03.png
据闻党政三期实现了将近4万套国产数据库部署,如果大家关注数据库招标信息,就会发现国产数据库采购几乎每天都在发生,而且招标公告完全不像数年以前含糊其辞,而是直接指明国产、信创等字样,甚至直接定向产品名称进行采购,这在10年前是无法想象的。而国资委在8月6号再次发文强调供应链安全,提供方法策略加速信创技术采购,一切都在证明,国产技术即将成为主流。

孙中山先生说 “天下大势,浩浩汤汤,顺之者昌,逆之者亡”。不管当下还有多少人对信创不理解,国产化都是当代中国的大势所趋,有意识的数据库人已经着眼未来,提前布局学习掌握国产技术了。

但数据库作为基础软件,还是有挺高门槛的,学习掌握必然要消耗大量时间精力,所以选择学习对象很重要,分享一下个人经验:

1、兴趣为主导,实战为目标

首先,对数据库技术没兴趣的千万不要硬着头皮去学,或者简单了解一下就好,否则只会体验到无尽的枯燥乏味和浪费大好时光;

其次,一定要结合自己所处的行业或者关注的业务系统属性,学习那些在未来职业生涯中有机会使用的产品;如果自己所处大数据、湖仓等业务部门,未来也没大可能脱离这一业务属性,那么去学一个交易型数据库,岂不难有用武之地。

2、重抓存款,适当投资

前一阵子我打算深入学习两款国产数据库(都是事务型的,分析型的现在实在没那么多精力)

一款集中式。企业场景广阔,永远不会被淘汰,掌握了一两个起码以后不会失业,这就像是知识“存款”,踹在兜里心里踏实。

一款分布式。代表了“创新”“先进”,“高端”,但是这些创新能不能有所回报现在还不确定,这属于知识的风险投资,搏一搏单车变摩托,当然也可能成为泡沫。

是踏实搞存款,深入研究成为专家,还是all in 赌一把分布式,这全凭个人兴趣爱好,我是比较谨慎,所以正在学习单机,但会关注分布式的动态,准备随时入坑。

3、一切回报,重在选择

做好心理建设和宏观规划,接下来就是确定学习对象的“人选”了,学习目标需要满足这4个基础条件:

(1)开放社区,在线文档。能够为学习、交流提供便利渠道;

(2)开放生态,兼容架构。虽然是学习,但我还是不想花费太多精力去学习一个未来可能彻底用不到的产品,所以就必须考虑应对这种情况发生的风险。

那就是学习一款比较开放的产品,包括SQL语法、运维体系,技术原理等,尽可能兼容开源生态(PG、MySQL),如果哪天学习对象真的“挂了”,这些知识储备还能快速在其他产品上得到有效利用。退一万步讲,万一哪天彻底开放了,开源产品也有强大的市场需求,学的东西总不至于浪费。

(3)下载通道、快速部署。这是基础,不能实操,纸上谈兵终是假把式,学不到什么真东西;

(4)产品前途,重在企业。企业/团队的生存能力直接影响学习成果的价值,起码等我学会时,这个企业、产品还在市场上流通,不然掌握了一款绝版数据库的技能,对我没有任何意义!

谁能生存下去,这三个厂商再活10年8年应该是没问题:

老厂,元老企业,自给自足。经过20多年的运营,这些元老数据库企业已经建立的相对完整的市场生态,例如达梦、金仓已经实现盈利、自给自足,这妥妥的百里挑一企业。

大厂,背靠大树,不愁滋养。数据库需要长期高成本投入,但不像硬件被制造工艺限制,只要投入足够就一定能得到一个不错的产品,而大厂有这个实力。

热厂,技术创新,前途无量。热度高的新兴分布式初创企业,经过小10年的打拼,也建立起了不错的市场份额,有资本支持、政策扶持,而且这很可能是未来支撑关键、核心业务的必备技术,不掌握一点都不好意思说自己懂数据库。

4、推荐产品,仅供参考

基于上面条件,按个人理解和兴趣选出了4个备选方案:

(1)集中式:人大金仓的KingBase、华为的openGauss。都是兼容PG架构,一个老厂一个大厂,学习一个基本就通用了。

  • 人大金仓搞国产数据库25年了,是中国最早的数据库企业,而且提供一些列对标Oracle的运维工具,包括kwr、ksh等,看名字也知道是干什么的了。

  • 华为的openGauss目前也很有人气,但是社区学习氛围似乎不是很高,所以可以找一个社区建设较好的商业版本进行,例如云和恩墨的MogDB。

(2)分布式:OceanBase 和 TiDB。两者人气都很高,属于热厂,兼容MySQL,虽然架构上有很多差异,但基本原理倒也相通,二者可以学习一个。

  • TiDB算是国内最早做的非常不错的开源社区,整体对待技术的态度都很开放,项目也是遍布全球,平时组织的社区活动、技术沙龙也多,学习的过程中还能参与活动、交流,认识很多新朋友。

  • OceanBase的社区虽然是后搞起来的,但是现在做的也是非常不错,文档材料也比较全面,而且最近IDC出具的金融行业分布式数据库市场份额中,OB在本地部署中获得了较大的市场份额,前途不可限量。

🎙️尹海文

副本_活动倒计时创意文字风公众号首图__2024081416_20_28.png
1、MOP是否还值得学习

我认为MOP依然值得学习,但也需要根据自身已有技术栈、职业发展阶段、工作环境等因素进行选择。在数据库国产化的浪潮中,先不说前两个目前都是美国Oracle公司的产品,即便是极其开放且宽松PostgreSQL似乎也被一些人钉在了黑名单之中。因此很多人认为MOP已经不值得学习了,就应该直接学习国产数据库产品。但在我看来MOP是否还值得去学习,得辩证地去看:

  • Oracle作为目前最强大的数据库产品,首先还是有很多先进的地方值得借鉴与学习的,作为关系型数据库的扛把子,同时很多数据库的基础大差不差,拥有最完善官方文档的数据库产品,通过学习Oracle还是可以很好的学习一些数据库基础的,并且目前仍然有一定规模的运行在Oracle数据库上的且替换难度比较大的存量系统,在一段时间内仍然有一定规模的数据库维护需求的。

  • 有部分国产数据库是基于MySQL研发的,学习MySQL可以更好的学习并使用这些数据库。且大量公有云数据库产品同样是基于MySQL,公用云相关仍然有大量的工作机会

  • 作为大多数国产数据库的“祖宗”,我觉得PostgreSQL是“传统”数据库中最值得学习的。PG的开放不止在于其社区,也在其技术架构,可以通过插件快速扩展功能。此外,目前PG也是“传统”数据库中发展最快的。

2、学习分布式数据库理论而不限于一款分布式数据库

现在分布式数据库也是一个比较火的话题,毕竟不少国产数据库都采用了分布式数据库架构,但要怎么去学习分布式数据库是一件比较头疼的事情,毕竟分布式数据库与集中式数据库特别在使用、优化层面有非常大的不同;而且各家分布式数据库的技术底座、实现方式等都有不同。

我认为学习分布式数据库,最重要的还是去学习相关的技术原理,比如分库分表相关知识、CAP理论、谷歌相关技术论文等等,毕竟分布式数据库也是若干数据库相关组件构成的,有一定数据库基础的基础上,有分布式相关理论的知识也能很好的去学习、使用。这里也推荐大家看看“传统”数据库Oracle的Sharding相关文档,看完之后会对分布式数据库有更深层次的了解。

🎙️尚雷

副本_活动倒计时创意文字风公众号首图__2024081416_29_58.png
1、如何选?

对于国产数据库选择,我觉得可以分两种,一种是对已运行一段时间的生产业务数据库做国产数据库替换,此时更应该从业务改造的难易角度出发,比如如果原来业务使用的是Oracle数据库,就可以选择一些对Oracle兼容度比较高,业务改造难度比较低的数据库,如果本身业务使用的MySQL数据库,则要选择和MySQL更兼容的数据库。对于一些新业务,在初期数据库选型时可供选择的余地更广。不管是哪种类型,在选择数据库时除了考虑经济成本,更应该看中这款国产数据库在市面上的普及度,尤其是该数据库在核心业务上的市场占有率,如果一款数据库吹嘘自己多么厉害,但很少有企业敢在核心业务上使用,证明该企业还是缺少竞争力。至于可供选择的数据库,可以从一些主流的数据库排行榜上可以一窥结果。

2、如何学?

如何学习国产数据库,白鳝老师在他的公众号写的《这三件事对成就一个优秀DBA极有帮助》这篇文章,对于DBA该如何选择一款国产数据库学习,给出了非常好的回答,文章给出三个方面的建议,分别是:第一,你选择什么数据库作为主攻方向,对于国产数据库的选择要抛弃固有偏见,要选择一个更好赚钱的国产数据库(比如不能选择一款开发都能很快解决问题的数据库);第二,寻找一个能更好提升自己能力的平台很重要,不要盲目选择培训提升自己,要敢于和高手沟通交流,不能只会提问,更应该想办法提升自己的沟通能力。第三:坚持写技术文章是提升自己能力的一个重要途径,通过写文章可以促进自己的学习和思考。至于学习资源,官方资料其实是最好的学习资源,特别是要善于学会运用谷歌和ChatGPT,其次是一些优秀作者写的书籍。


国产数据库的发展已是大势所趋,一方面国家政策大力支持信创技术采购,推动国产化进程;另一方面,国产数据库企业不断创新,在技术上取得了显著进步。学习国产数据库,不仅能为个人职业发展带来更多机会,也能为国家信息技术的自主可控贡献力量。同时,国产数据库的生态系统也在不断完善,学习国产数据库可以参与到社区和行业交流中,与同行共同成长,为自己的职业发展积累经验和资源。但与此同时,Oracle等在国内应用十分广泛的国外数据库也有很多值得学习、借鉴的地方,依旧可从这些国外数据库的学习实践中汲取经验。

正如以上专家所言,在选择学习的国产数据库时应从自身工作需求、职业发展规划出发,综合考虑产品技术实力与应用现状、生态发展情况等因素,切勿盲目跟风。学习时可以充分利用厂商的资源、从官网文档入手,多学多测、多思考多交流,保持正确的心态、知难而上、客观积极处理遇到的问题。希望各位专家的观点能为各位正在学习国产数据库、或准备学习国产数据库的你们提供参考。

本文已收录至《墨天轮专家邀稿合辑:论道数据库 解读新发展》,也欢迎大家分享您想要学习的国产数据库和学习方法,互相交流借鉴。

最后修改时间:2024-11-19 16:04:27
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

小AI
暂无图片
6月前
评论
暂无图片 0
学国产数据库,到墨天轮技术社区
6月前
暂无图片 点赞
评论
鲁鲁
暂无图片
7月前
评论
暂无图片 2
先从官方文档开始,申请测试安装介质,熟悉体系结构、安装部署、备份恢复、性能优化、迁移等,当然你很有可能卡在第一步,你要学习的国产数据库没有官方文档,或者官方文档不全,这是常有的事,所以学习国产数据库第一步是放平心态,别总盯着缺点,期望越大失望越大。
7月前
暂无图片 2
评论
墨天轮编辑部
暂无图片
7月前
评论
暂无图片 0
大家有什么想向专家提问的疑惑也欢迎分享在评论区~后续【专家有话说】栏目将继续为大家带来建议、干货~
7月前
暂无图片 点赞
评论
zy
暂无图片
7月前
评论
暂无图片 0
行业应用激增,国产数据库学习路在何方
7月前
暂无图片 点赞
评论
S
senllang
暂无图片
7月前
评论
暂无图片 1
道路漫长,一起加油。
7月前
暂无图片 1
评论
严少安
暂无图片 暂无图片
7月前
评论
暂无图片 1
学国产数据库,到墨天轮技术社区
7月前
暂无图片 1
评论
查看更多 >