数据可信度差。
效率低。
加大数据理解难度。
为了让数据更好的使用,这些问题亟需解答。首先我们来对比一下线上数据与决策支持系统(DSS)需求的数据的差别。
操作数据与分析数据
线上数据,是原子的,状态数据,反应的是用户当前时刻的状态。而DSS系统需要的,不仅是当前时刻的状态数据,还需要历史中的数据。
关于过程数据与历史数据,我们以银行存款为例进行说明(如图1)无论什么时刻,我们在线上系统,只能查询到当前时刻的状态,比如日期1003查到攻城锤有100元存款,过去的时间里,攻城锤有多少钱是不得而知的,当前的状态,是分析的一部分,而变化的历史,也是分析的重点。
用户是谁?
数据仓库的用户是分析师。分析师是什么人呢?他们主要工作是定义规则(数据处理规则,指标计算规则等),以及根据数据发现业务发展中的信息,得出结论,给出建议。
为了给分析师提供数据服务,需要知道分析师的做事特点,即:"先给我看一下我说我想要的东西,我才能知道我真正想要什么"。这句话的意思是,分析是逐步进行的,没有哪个分析师能在刚开始就决定好分析的方式以及内容,需要一次次的调整,才能得到最终的需求。所以分析师提需求特别是改需求的时候,不要打分析师(^_^)。监控
数据进入数据仓库,变成数据资产,监控数据资产是管理数据仓库的基本能力,通过对监控我们能获取到很多重要的信息,为我们建设数据包括硬件计划都有意义。举其中重要的内容为例:发生了哪些增长,在什么位置/以什么速率发生增长
哪些数据被使用
数据被使用频次
数据服务的响应时间 当数据仓库的建设人员都无法回答这些问题时,那高质量的数据建设是不可能成功的。 小结
DSS的需求以及数据处理逻辑的发展,线上OLTP数据与DSS需求数据有差异,需要单独建设,在建设的时候需要了解用户是谁,用户关注什么。并且对数据进行良好的监控。
文章转载自攻城锤的数据仓库,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
2025年4月中国数据库流行度排行榜:OB高分复登顶,崖山稳驭撼十强
墨天轮编辑部
1608次阅读
2025-04-09 15:33:27
2025年3月国产数据库大事记
墨天轮编辑部
807次阅读
2025-04-03 15:21:16
2025年3月国产数据库中标情况一览:TDSQL大单622万、GaussDB大单581万……
通讯员
575次阅读
2025-04-10 15:35:48
征文大赛 |「码」上数据库—— KWDB 2025 创作者计划启动
KaiwuDB
482次阅读
2025-04-01 20:42:12
数据库,没有关税却有壁垒
多明戈教你玩狼人杀
456次阅读
2025-04-11 09:38:42
国产数据库需要扩大场景覆盖面才能在竞争中更有优势
白鳝的洞穴
438次阅读
2025-04-14 09:40:20
最近我为什么不写评论国产数据库的文章了
白鳝的洞穴
362次阅读
2025-04-07 09:44:54
天津市政府数据库框采结果公布!
通讯员
340次阅读
2025-04-10 12:32:35
【活动】分享你的压箱底干货文档,三篇解锁进阶奖励!
墨天轮编辑部
307次阅读
2025-04-17 17:02:24
优炫数据库成功入围新疆维吾尔自治区行政事业单位数据库2025年框架协议采购!
优炫软件
303次阅读
2025-04-18 10:01:22