暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
一种基于htap数据库的分布式储存方法_CN115438046B_北京万里开源软件有限公司.pdf
34
14页
0次
2024-04-25
免费下载
(19)国家知识产权局
(12)发明专利
(10)授权公告号
(45)授权公告日
(21)申请号 202211023175.5
(22)申请日 2022.08 .25
(65)同一申请的已公布的文献号
申请公布号 CN 115438046 A
(43)申请公布日 2022.12 .06
(73)专利权人 北京万里开源软件有
地址 100000 北京市丰台区汽车博物馆东
路6号院3号楼10层1单元1001内18室
(72)发明人 娄帅 郑超 林韶宾 党中华 
张文凤  龙禹 王佳明 
 
(74)专利代理机构 北京冠和权律师事务所
11399
专利代理师 赵银萍
(51)Int.Cl.
G06F
16/22
(2019 .01)
G06F
16/27
(2019 .01)
G06F
16/28
(2019 .01)
G06F
16/174
(2019 .01)
(56)对比文件
CN 103188346 A ,2013 .07 .03
CN 112487093 A ,2021 .03 .12
US 2021297480 A1 ,2021 .09 .23
审查员 陈菲菲
(54)发明
一种基于HTAP数据库的分布式储存方法
(57)摘要
发明种基HTAP库的
据导系统
数据源中的数并存储于HTAP数据库的存
擎中处理器将数据分散存储到各进程的服务
构建一组程的布式
据上有分布式存储中源并行剖分对数据进行
重新分布构建数据上与源并行剖分对应的目标
并行剖分的分布式存储根据数据在一组进程的
分布式存储及目标并行剖分的分布式存储构建
分布式存储模型适应适量查找压缩算法
进行据压缩并加密HTAP据库的布式
本发实时务决
且昂贵的数据仓库技术操作更快地对最新数
构建布式程的
荷。
权利要求书3页 说明书8页 附图2页
CN 115438046 B
2023.03.28
CN 115438046 B
1 .一种基于HTAP数据库的分布式储存方法其特征在于包括下步
系统据源中的HTAP数库的引擎
将数据分散存储到各进程服务器中构建数据在一进程的分布式存储
构建数据上与源并行剖分对应的目标并剖分的分布式构建布式存储模型
现HTAP数据库的分布式储存
构建数据在一组进程分布式存储包括
接收要存储在具有多个各进程服务器中的数
负载算时相等的度为划分
计算量再根据计算量确定数据剖分
确定剖分接收据的少一相关与数相关联的
性来分区数据以存储在服务器中将所分区的据存储在与多个数据服务器相关联的存
单元中
处理器计算负载平衡状态的公式为
其中h表示平衡诊断
M
表示处器数与进程一一对应
z
表示为处理器的
序号 表示处理行一次的计算时 表示号为1的运行一次的算时
表示预定义处理器的负载平衡阈值
负载平衡状态动控制方程为
其中
i
j
程的
j
程的总负
M
表示处理器的
n
表示个数据的 表示序号
i
处理上的
j
个进
程访问的次 表示序号为
i
处理器上的
j
个进程的独立性 表示在序号为
i
的处
器上的
j
进程行的时间 表示号为
i
器上的
j
进程花费的执行的
重。
2.1HTAP库的引擎
权 利 要 求 书
1/3
2
CN 115438046 B
2
存储引擎模块询及数据导入服模块需询数要向HTAP数据库发
出请求
引擎引擎模块保障引擎模块
化到磁盘据通过多副本机制存放同时维护了副本之间一致性
数据导入服务模块根据存储引擎模块负载情况实现负载均衡
询模布式引擎指派引擎存储
擎以接收构化询语言后生成分布式逻辑划优后转为
式的物理执行计并生成物理算子分散到存储擎模块集群中进行调度和执行。
3 .如权利要求1所述的HTAP数据库的分布式存方法其特在于处理计算
载平衡状态通过平衡诊断量与预定义的处理器的负载平衡阈值进行平衡诊断量不
于预义的器的负载衡阈则处理据计划分确定剖分
平衡诊断量大于预定义的处理器的负载平衡阈值时则按照最平衡诊断量的数值进
计算量划分确定数据剖分通过平衡诊断量与预定义的处理器的负载平衡阈值进
保处理器不会超载。
4 .如权要求3所述的基于HTAP数库的分布式存方其特在于处理器的负载
平衡状态动控制在6%以内
5 .如权利要求1所述的HTAP数据库的分布式存方法其特在于据数据上已
有分布式存储源并剖分对数据进行构建据上与源并剖分对应的
并行剖分的分布式存储。
6 .如权利要求1所述的HTAP数据库的分布式存方法其特在于据数在一
程的布式存储及目剖分的布式构建布式存储
量查找压缩算法进行数据压缩并加密实现HTAP数据库分布式储存。
7 .如权利要求6所述的基于HTAP数库的分布式存方其特在于布式存储
型的构建方法包括
对在一组进程分布式存储标并行分的数据按照类型分类
取数据特征作为分配到各服务器存储分散因子
结合一致性哈算法以布式环境拟化服务作为数存储核心用动态分配策
将虚拟化服务器动态地分配到一致性哈希环形空间依据抽取的特征信息将数据均匀地
分配到各虚拟存储服务器
虚拟服务器存节点内使面向对象库收集和管理与处理器交换数
信息信息拟磁盘空间以直接法的件目录结储数通过
数据库建立索引支对数据并发模糊检索。
8.如权利要求6所述的于HTAP数库的分布式存方法其特在于适应适量查
找压缩算法进行数据压缩具体包括
码器第一读取后数书中码字均由
列标和内识组第一次接收码书是没容的码书码写第一
个序列标识将重新分布后数据写入第一个内容标识并将码字写入存储数据流
再次后数据时进行在码到内使
与再次读取新分后数相同么取出内应的序列标列标
权 利 要 求 书
2/3
3
CN 115438046 B
3
of 14
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。