暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

让数据先“活”起来,如何实现数据在企业中的最大价值

开头还是介绍一下群,如果感兴趣PolarDB ,MongoDB ,MySQL ,PostgreSQL ,Redis, OceanBase, Sql Server等有问题,有需求都可以加群群内有各大数据库行业大咖,可以解决你的问题。加群请联系 liuaustin3 ,(共2790人左右 1 + 2 + 3 + 4 +5 + 6 + 7 + 8 +9)(1 2 3 4 5 6 7群均已爆满,,开8群近300+ 9群)


数据是一种宝贵的资源,知道数据十分宝贵的人很多,但如何运用数据让其发生效用的人并不多,今天借着机会,和唐建法老师请教关于数据如何发生效用的事情,让数据也能为企业带来效益,同时作为一个数据库架构师、DBA,我也想听到更新、更有价值的知识,数据到底是什么、Data as service 数据即服务 、数据流转的最终目的是什么,我想寻求真实的答案。

专访唐建法-从MongoDB中国第一人到TapData掌门人的故事

我: 唐老师好,上次关于您的那篇文章,在去年刊登的,作为我们行业偶像级的人物,让很多人都迷惑,如何能成为一个有价值的数据库行业从业者,在我们逐步认知到数据运维的价值在AI、自动化运维、以及各种工具平台的压缩下,价值逐渐走低的当下,我们该如何找到新的思想定位和工作方向。

唐老师:这个问题,我个人并不想给出特别明确的建议,每个人都是不同的,每个人都有自己的路要走,说一个自己的故事,在我刚开始在美国工作的时候,我是一个程序员,还是一个前端程序员,当时我并没有思考与数据库有关的事情,专心写代码完成工作,和数据库打交道是从我创业的时候开始的,当时我要负责更多的后端程序,由此和MySQL发生了一段不是很愉快的经历。

那时对索引的知识一无所知,但我必须解决大量的客户访问平台引起的数据库故障的问题,随之MySQL经常DOWN机的问题频繁发生,让我手足无措,从那时我才和数据库开始了更进一步的关系,当时访问的量比较大,后面我们接触到了MongoDB,虽然那时的MongoDB数据库本身是有一些缺陷的,比如当时的版本是没有的事务功能的。可我们需要马上解决关键的系统问题,用户访问量高、并发高的问题,我们用MongoDB替换了MySQL后,高并发访问量的问题解决了,这话说10多年前了,随着深入到MongoDB后,并喜欢上这个数据库最终成为这个产品的首席架构师,我解决过很多企业的数据问题,在不断的接触客户,解决问题,我发现新的让我感兴趣的事情,很多企业在发展的过程中,数据的价值被大大低估的问题,这也是我出来创业的原因,发现问题,解决问题,体现价值。

我:抱歉唐老师,我打断您,您并没有回答我刚才的问题,或者我没有get 到您的点!

唐老师:其实我想说的是,在你的本职行业中,持续深挖,不做表面的事情,用你自己的知识和阅历来解决他人的问题,这就是你的价值所在。

我: 您在之前一直提到一个名词 Data as service,DaaS。实话我作为一个DBA 或 数据库架构,我对这个部分知识,并不是很理解和领会。Daas怎么产生商业价值,或者商业为什么需要DaaS,这个您能给讲一讲吗?

唐老师:是的,我可以举一个例子,DaaS(Data as a Service) ,比如一个零售体,现在经营都是以数据为导向的,比如我的财务,库存,销售,会员,线上系统,线下门店,这些都是数据的产生者,也都是数据的消费者。在顾客购买了一个产品后,库存需要减1,销售系统需要+1,财务系统需要产生收入,然后还要区分这个产品是线上平台,还是线下门店销售的,最终零售这个大系统要做出如下的一些决策

1  产品是否要补货

 2  产品是否要调价 

3  产品进货后,损耗后的总成本摊销 

4  补货后财务系统的出账 

5  会员系统是否要跟进这个顾客,诱导这个顾客继续复购,推算什么时间应该对他进行促销

6  仓库系统的进货和出货的流水账,以及库存的情况是否能及时更新

现在大型的零售机构以数据驱动服务,数据来自于企业的运营,数据服务于各个对应的部门并产生对应的决策性和指导性的作用。

我:那么问题在哪里呢? DaaS 数据即服务,企业只要知道数据的作用和数据怎么使用就可以了,这是一件困难的事情吗?

唐老师:我们假设,这些部门的系统都是单独购买的,这样的事情我们遇到的太多,太多了。企业部门之间在IT信息本身并不沟通的案例很多,这里购买一个系统,那里购买一个系统。DaaS这个关于企业最重要的部分就变成一个,可以贴到公司墙上的标语,但无法落地。

我:您这边有具体的案例吗?

唐老师:我们有不少这样的案例,如一个百年药企的案例,传统企业逐步认识到了数据驱动业务的重要性,这家企业遇到的几个问题,数据库的类型不统一,网络的类型不统一,应用系统的不统一,POS系统的不统一,而他们要对接统一的医保系统,2000家门店,如何解决这些问题。

核心就是数据,数据被封堵,数据无法流转,数据的价值无法实现,每个企业并不关心他们用的数据库是Oracle、SQL SERVER、MySQL、 PG, 他们的核心诉求是这些数据库中的数据能否产生价值,能否抵御同行业的企业之间的竞争,存在数据库里面的数据是死的,流动起来的数据是活的,很多企业都开始认知到这件事。

所以我们解决这样的问题,拿出了成熟的产品和方案,让我们的客户解决他们的第一个问题,让数据“活”起来。

我:这就是您所一直提及的DaaS,数据即服务的第一步,是否可以理解为数据要产生价值,服务企业的第一步是数据能灵活的流转,您做的产品和服务就是要实现这个目的。我有一个尖锐的问题,这不是ETL&CDC软件吗?市面上有很多这样的软件。

唐老师:ETL或者cdc的软件市场的确有很多这样的软件,像一个数据的搬运工。但TapData不会,我们的产品本身站的角度就与那些软件不同,我们站的角度并不是一个工具类的软件,我们最终要做的是要体现数据的价值,帮助企业实现自己的真正需求。我不知道你看过没有看过我们的产品序列。

TapData 三部曲,TapData Cloud, Tapdata Community, Tapdata Enterprise。 实际上我们将产品和客户进行了细分,TapCloud主打的是短平快的数据迁移市场,且我们比DTS 阿里云的那个云服务,在云上更有产品竞争力。Tap Community是让客户去试用我们的产品,让客户先体会DaaS的基础是什么,TapData和其他的ETL&cdc软件的不同在哪里,或许从一开始我们从做产品的角度看,这就有很大的不同。最后还有Enterprise的产品,我们会对企业级别的客户提供高标准的软件,服务,甚至是定制化的服务。我们可以参与到企业的实际需求中,帮助企业完成一些ETL&CDC软件无法满足的企业数据处理特殊需求。

我:您提到的前三个产品我明白,通过软件服务的不同等级来对应不同的客户。但是定制化,难道ETL&CDC还需要定制化,有这个必要吗? 或者什么需求让您觉得有这样的一个必要定制化。

唐老师:我们正在做一个比较大的项目,一个海外的项目,某个大型的政府机构要提高政府服务的能力、减少政府财政负担的项目,这个项目就是一个TapData定制化的案例,其中有一些数据库产品的操作系统问题在大多数ETL&cdc软件并不支持,如DB2 这样的数据库产品,支持的系统本身就种类繁多,如AS400,LINUX,客户的系统不同,需要在不同的项目中给与支持,我们在不断的引入海外项目后,发现我们支持的数据库种类和对应数据库的操作系统越来越丰富,我们从之前服务国内,已经扩展到更丰富的领域和地域了。 同时我们还可以把我们的DaaS 的理念带入到这个项目,我们有能力帮助客户,发现整体的项目哪里是数据使用的短板,让这个项目运作的更有效,更顺畅。 那么我并不认为TapData是一家纯卖软件的公司,我们比那些纯卖软件的公司“实际”的多。很多情况下,在帮助超大型企业,走出DaaS的困局和误区。TapData可以做的事情比他们想的要多的多。

我:这和我之前听到的那些硬邦邦的ETL&cdc软件理论完全不一样,如果要形容,我觉得您在做一件看上去很柔软,但实际上很韧性的事情,或者说因为懂得太多了,所以可以承担的责任就更多,那么Tap Cloud呢,这是一个什么样的产品?

唐老师:我们在做Tap Cloud的时候,很直接,很简单,很单纯,我们要的就是服务线上用户,这些线上用户单纯的数据迁移和同步的需求,不过我们把简单的事情做的很灵活和安全。

我: 在云端,我可以选择将处理的主机,放到本地,云端此时就是一个服务和操作端,数据并不经过云来传输,我实际操作过,但我没有弄懂需求,这是什么需求促成这样的产品。这是操作TapData Cloud让我迷惑的事情,明明是云,可为什么最核心的主机可以放到线下,当然它也可以在线上?

唐老师:说到这个,其实还是要感谢我们一些客户的数据安全的需求,这是一些对灵活部署非常看重的客户,与此同时对于数据安全审核的要求又比较高的中小型企业,所以TapData云上产品的核心可以云下部署的方案看似矛盾,但却是我们在深入理解客户的难处和实际需求下的产品,既可以上云,同时可以做到数据不经过云传输,TapData能满足这类客户的需求,他们的核心数据传输的主机完全可以部署在自己的机房,但控制和服务可以在云端,数据并不经过云,或者说完全和TapData云无关。所以我们非常感谢提出这些需求的企业,打造了一个他们非常安心,且专业的ETL&cdc的云服务软件。

我:看来坐在屋子里面做软件,不去真实拜访客户做出来的软件和懂客户的需求,更用心的去做产品是有很大的差别,这才有了TapData Could。我在使用的时候有一个想法,可能比较尖刻,我有一个看法,我不认为TapData Could 能成功,因为我一直在用DTS,阿里云的DTS 的产品,我不认为您的产品可以和DTS相比,且TapData Cloud也没有阿里云的DTS有名。

唐老师:这个是一个好问题,您也不是第一个问这个问题的人,我也有几个问题想问一下您。

1  公司要求数据传输服务必须本地部署,虽然是一次性的数据传输任务,但必须本地部署。

2  数据的传输量大,且传输时间长,DTS服务中的产品规格并不能满足客户的实际需求

3  数据库种类的丰富度,TapData是一个中立的ETL&cdc软件,相对阿里云的DTS,在支持国产数据库的种类和中立性方面,都更胜一筹。

4  还有一个关键的问题,我相信您作为阿里云忠实的客户,应该知道,DTS本身的一些问题,如不能及时处理一些单库表太多的情况,您是否遇到过呢?

我:您怎么知道的,DTS 的确是有这样的小问题,我们在使用中是遇到过的,大量的表在传输中有卡主的情况,处理速度还需要提高,我们有时会提高BINLOG 或 WAL LOG的留存时间,您怎么知道的这个细节的???

唐老师:我自己会经常和客户做一些直接的业务场景和产品使用的沟通,获得第一手的反馈。,这些信息非常有助于改进TapData, 让TapData能走得更远更长久。我有我自己的想法,我想去实现我的价值帮助客户梳理真实需求,是我们前进的动力。同时我也有一个问题想问,您觉得一个好的ETL&cdc的软件的标准是什么?

我:坐在屋子里面,想客户的需求,做出来的东西和真切到客户身边,冲在第一线的产品,理解客户真实需求的产品是100%的不同。那我可以说,您是一个懂企业数据价值的人吗?

唐老师:这个可不敢,但我们是以客户真实的需求为源头,而不是坐在屋子里面,自己臆想客户的需求,并给出解决方案的,您知道我一年要跑多少客户吗? 我的火车票和机票钱并不是一个小数字,可我愿意和我的客户沟通,和他们以最近的距离,去感受他们的难,TapData并不光在做一个产品,我们和客户是一体的,客户的问题就是我们存在的意义,这是我心里一直提醒我自己且让我持续能有动力,做好我们产品的根本。


我: 牵扯到企业内部运作和数据流及数据应用的问题,这就不是一般技术专家能搞定的了,这和您之前在多家企业做架构师的职业经历有关系对吗?

唐老师:你不知道你的过往会给自己带来什么,做一件事情,只要对客户有益并可以挖掘数据价值的事情,我都愿意去理解,只要有时间有精力,因为你不知道在什么时间,这些宝贵的企业服务经历,就变成你能冲击更高端的能量。

我:最后一个问题,作为数据库行业的从业者,我们怎么能提高自己,这是我们很多从业者关心的问题。

唐老师: 我个人的观点,不要把自己圈在一个范围,比如我就是某某的DBA,这样会给自己封堵住路,你可以是一个DBA,你可以是一个数据库架构师,你还可以是一个企业级的数据架构师,数据治理师。不要给自己限定范围,首先要懂得多,接触的知识丰富,一句话你要对新事物感兴趣并能发现其中的价值。

我: 我非常赞同您的话,狭隘的世界观,只能束缚自己,感谢您的时间。




置顶
专访唐建法-从MongoDB中国第一人到TapData掌门人的故事
ETL 行业也够卷,云化ETL,ETL 软件不过了
天上的“PostgreSQL”  说 地上的 PostgreSQL 都是“小垃圾”
宇宙的“PostgreSQL” 说 “地球上的PG” 都是“小垃圾”
云数据库核爆在内部,上云下云话题都是皮外伤!--2025云数据库专栏(二)
云原生 DB 技术将取代K8S为基础云数据库服务-- 2025年云数据库专栏(一)
临时工:数据库人生路,如何救赎自己  -- 答某个迷茫DBA的职业咨询


PostgreSQL 相关文章

PostgreSQL逻辑复制槽功能

PostgreSQL 扫盲贴 常用的监控分析脚本

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL  添加索引导致崩溃,参数调整需谨慎--文档未必完全覆盖场景
PostgreSQL 的搅局者问世了,杀过来了!
PostgreSQL SQL优化用兵法,优化后提高 140倍速度
PostgreSQL 运维的难与“难”  --上海PG大会主题记录
PostgreSQL 什么都能存,什么都能塞 --- 你能成熟一点吗?
PostgreSQL 迁移用户很简单 ---  我看你的好戏

PostgreSQL 用户胡作非为只能受着 --- 警告他

全世界都在“搞” PostgreSQL ,从Oracle 得到一个“馊主意”开始
PostgreSQL 加索引系统OOM 怨我了--- 不怨你怨谁

PostgreSQL “我怎么就连个数据库都不会建?” --- 你还真不会!

病毒攻击PostgreSQL暴力破解系统,防范加固系统方案(内附分析日志脚本)
PostgreSQL 远程管理越来越简单,6个自动化脚本开胃菜

PostgreSQL 稳定性平台 PG中文社区大会--杭州来去匆匆

PostgreSQL 如何通过工具来分析PG 内存泄露

PostgreSQL  分组查询可以不进行全表扫描吗?速度提高上千倍?

POSTGRESQL --Austindatabaes 历年文章整理

PostgreSQL  查询语句开发写不好是必然,不是PG的锅

PostgreSQL  字符集乌龙导致数据查询排序的问题,与 MySQL 稳定 "PG不稳定"
PostgreSQL  Patroni 3.0 新功能规划 2023年 纽约PG 大会 (音译)
PostgreSQL   玩PG我们是认真的,vacuum 稳定性平台我们有了
PostgreSQL DBA硬扛 垃圾 “开发”,“架构师”,滥用PG 你们滚出 !(附送定期清理连接脚本)

DBA 失职导致 PostgreSQL 日志疯涨



OceanBase 相关文章
OceanBase 6大学习法--OBCA视频学习总结第五章--开发与库表设计
OceanBase 6大学习法--OBCA视频学习总结第四章 --数据库安装
OceanBase 6大学习法--OBCA视频学习总结第三章--数据库引擎
OceanBase 架构学习--OB上手视频学习总结第二章 (OBCA)
OceanBase 6大学习法--OB上手视频学习总结第一章
没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛
OceanBase  送祝福活动,礼物和幸运带给您

跟我学OceanBase4.0 --阅读白皮书 (OB分布式优化哪里了提高了速度)

跟我学OceanBase4.0 --阅读白皮书 (4.0优化的核心点是什么)

跟我学OceanBase4.0 --阅读白皮书 (0.5-4.0的架构与之前架构特点)

跟我学OceanBase4.0 --阅读白皮书 (旧的概念害死人呀,更新知识和理念)

聚焦SaaS类企业数据库选型(技术、成本、合规、地缘政治)

OceanBase 学习记录-- 建立MySQL租户,像用MySQL一样使用OB


PolarDB 相关文章

“PostgreSQL” 高性能主从强一致读写分离,我行,你没戏!

PostgreSQL 的搅局者问世了,杀过来了!

在被厂商围剿的DBA 求生之路 --我是老油条

POLARDB  添加字段 “卡” 住---这锅Polar不背

PolarDB 版本差异分析--外人不知道的秘密(谁是绵羊,谁是怪兽)

在被厂商围剿的DBA 求生之路 --我是老油条

PolarDB 答题拿-- 飞刀总的书、同款卫衣、T恤,来自杭州的Package(活动结束了)

PolarDB for MySQL 三大核心之一POLARFS 今天扒开它--- 嘛是火




MySQL相关文章
MySQL SQL优化快速定位案例 与 优化思维导图
"DBA 是个der" 吵出MySQL主键问题多种解决方案
MySQL 怎么让自己更高级---从内存表说到了开发方式
MySQL timeout 参数可以让事务不完全回滚
MySQL 让你还用5.7 出事了吧,用着用着5.7崩了
MySQL 的SQL引擎很差吗?由一个同学提出问题引出的实验
用MySql不是MySQL, 不用MySQL都是MySQL 横批 哼哼哈哈啊啊
MYSQL  --Austindatabases 历年文章合集

MongoDB 相关文章

MongoDB  大俗大雅,上来问分片真三俗 -- 4 分什么分

MongoDB 大俗大雅,高端知识讲“庸俗” --3 奇葩数据更新方法

MongoDB 学习建模与设计思路--统计数据更新案例

MongoDB  大俗大雅,高端的知识讲“通俗” -- 2 嵌套和引用

MongoDB  大俗大雅,高端的知识讲“低俗” -- 1 什么叫多模

MongoDB 合作考试报销活动 贴附属,MongoDB基础知识速通

MongoDB 年底活动,免费考试名额 7个公众号获得

MongoDB 使用网上妙招,直接DOWN机---清理表碎片导致的灾祸 (送书活动结束)

MongoDB 2023年度纽约 MongoDB 年度大会话题 -- MongoDB 数据模式与建模

MongoDB  双机热备那篇文章是  “毒”
MongoDB   会丢数据吗?在次补刀MongoDB  双机热备
MONGODB  ---- Austindatabases  历年文章合集

临时工访谈系列

没有谁是垮掉的一代--记 第四届 OceanBase 数据库大赛

ETL 行业也够卷,云化ETL,ETL 软件不过了


SQL SERVER 系列
SQL SERVER维保AI化,从一段小故事开始
SQL SERVER 如何实现UNDO REDO 和PostgreSQL 有近亲关系吗
SQL SERVER 危险中,标题不让发,进入看详情(译)






文章转载自青年数据库学习互助会,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论