暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种兼容数据仓库和数据湖的数据存储平台构建方法_徐辛_CN 114528273 A_石原子科技.pdf
207
6页
0次
2022-11-28
25墨值下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202210031313.8
(22)申请日 2022.01.12
(71)申请人 石原子科技有限公
地址 310000 浙江省杭市余五常街
道西坝路51号B座203、204室
(72)发明人 徐辛 
(74)专利代理机构 沈阳工匠智诚知识产权代理
事务所(普通合伙) 21256
专利代理师 孙楠
(51)Int.Cl.
G06F
16/21
(2019 .01)
G06F
16/22
(2019 .01)
G06F
16/28
(2019 .01)
(54)发明
种兼和数湖的据存
台构建方法
(57)摘要
本发明公开的属于数据处理技术领具体
种兼据仓和数湖的
构建括以骤1列式
库的据进
存储步骤2对数据仓库和数据湖的存储层进行
整合并采分区的方式独立区隔数据湖和数据
仓储的存储区步骤3构建统一的元数据管理
通过本层实现对上层应负载屏蔽底层存储
本发明不仅可保证数据湖和数据仓库的正
常使还可解决在两个产品之间存在的数
余问并向户提供局统据管
还能够减少并简化
体的和运少数
本。
权利要求书1页 说明书3页 附图1页
CN 114528273 A
2022.05.24
CN 114528273 A
1 .一种兼容数据仓库和数据湖据存储平构建方法其特征在于包括下步骤
步骤1用列式存储及行列混存对数据湖和数据仓库据进行存储
步骤2对数据仓和数存储层进行整合分区方式立区隔
数据仓储的存储区域
步骤3构建统一的据管理通过层实现对上屏蔽底层存储实
提供用负载的服务进一步的可以面向户提供局统一的据管
理视图
其中据管层包湖的用负据平据平
层包括数据层和元数据管理及数据管控层。
2.据权1述的种兼和数湖的平台
征在于述数据层用于存储数仓和数据真实的物理数且数据层包括Raw据湖
内的原始数Modeled据仓库内经加工处结果Staging据仓库内
行数据加工处理时需要临保存的暂存数据。
3 .1据仓和数据存平台构建
在于所述据管据管用于管层数据层内的部数元数
提供对上层的统一数据服务且元数据管理及数据管控层包括据管控面向下层数据层
内数据的管控功能可以实现数据分区据监控据统一管理等服务数据管理元数
据管据管在数层中据的Unity
catalog形式向上用负载提供统一的数据服务。
4 .1述的种兼据仓和数湖的构建
征在于所述步骤1中数据湖和数据仓库据存储与计算相互分离。
权 利 要 求 书
1/1
2
CN 114528273 A
2
一种兼容数据仓库和数湖的数据存储平建方法
技术领域
[0001]
本发明涉及数据处理技术领体为一容数据仓和数据据存储
台构建方法。
背景技术
[0002]
现状着大据时代的到多越多的大数据产品出现其中数据仓库和数
是两较有代表性的大数据产品为提供服务。
[0003]
1 .数据湖是对各类未经处理的原始数据的存包括任意规模的结构化
构化和非结支持便访问湖可以用来当作数
或其他大数据应的数据来源。
[0004]
2 .据仓用于作为析的库选包括据大
交互式分析和其他性能分析。仓一般仅包含经过处理和精炼据。
[0005]
[0006]
种产品使用场景不同湖存加工的始数据数括结
半结构化和非结构化据仓库存储经过处理和精炼据。一般情况下会被当
两个彼此独立的产品提供湖和数据仓库分别管理各自部的
现状所带来的问题主要包括两方面
[0007]
1 .存在着大量据冗余造成极大的存储成本浪费
[0008]
企业中同在着大量的即需要保留原始数同时要做经一处理和精炼的
那么这部分数据就要被时保存在数据湖和数据仓库造成存储成本浪费
[0009]
2.无法面向用户提供全局统一据管理视
[0010]
个问易理产品之间在着量的而且
湖和数据仓库两个产品的数据目录是彼此独立的就造成了用户法全局统一的对数
进行管理无法看清全局数据全貌。
发明内容
[0011]
本发明的目在于提供一种兼容数据仓和数据据存储平台构建方
解决景技术中提出的着大量的据冗成极大的储成浪费无法面向
用户提供全统一的数据管理视图的问题。
[0012]
为实述目的本发提供如下种兼据仓和数
存储平台构建方法包括下步骤
[0013]
步骤1用列式存储及行列混存对数据湖和数据仓库据进行存储
[0014]
步骤2对数据仓库和数存储层进行整合分区的方式独立区隔
湖和据仓储存储区域
[0015]
步骤3构建统一的元据管理通过本层实现对上层应负载屏蔽底层存储实
提供用负载的据服进一步的可以面向局统一的
说 明 书
1/3
3
CN 114528273 A
3
of 6
25墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。