大规模并行处理器数据库系统和方法
[0001]
相关申请案交叉申请
[0002]
本申请要求于2015年1月21日递交的发明名称为“大规模并行处理器数据库系统
和方法”的第14/601 ,679号美国普通专利申请案的在先申请优先权,其内容以引入的方式
并入本文。
技术领域
[0003]
本发明涉及数据库系统和方法,尤其涉及大规模并行处理器数据库系统和方法。
背景技术
[0004]
大规模并行处理(Massively Parallel Processing,简称MPP)数据库管理系统通
过向服务器分配数据并在多个服务器上运行单独事务进行扩展。为实现高吞吐量和低时
延,MPP数据库向多个服务器分配数据和查询。无共享架构通过添加用于集群扩展的新服务
器进行扩展。MPP数据库可以通过添加更多的服务器来扩大存储和计算容量。在通过添加服
务器进行扩展时,将会向新的服务器分配数据。较慢的服务器可能会支配性能,这可能会因
数据分布不均匀导致恶化。服务器的工作负载可取决于存储的数据量。
发明内容
[0005]
本发明一实施例中的方法包括 :确定大规模并行处理(massively parallel
processing,简称MPP)数据库集群中初始服务器的数量;确定所述MPP数据库集群的初始哈
希桶配置,其中,所述初始哈希桶配置具有初始哈希桶的数量。所述方法还包括:将一定数
量的附加服务器添加到所述MPP数据库集群中以生成一定数量的更新服务器,其中,所述更
新服务器包括所述初始服务器和所述附加服务器;根据所述初始服务器的数量、所述初始
哈希桶配置和所述附加服务器的数量创建更新哈希桶配置,其中,所述更新哈希桶配置具
有更新哈希桶的数量。此外,所述方法包括:根据所述更新哈希桶配置重新分配所述MPP集
群的数据。
[0006]
本发明一实施例中的方法包括:根据初始服务器的数量和添加的服务器的数量为
大规模并行处理器(massively parallel processing,简称MPP)数据库集群确定更新的哈
希桶-服务器映射;根据所述更新的哈希桶-服务器映射和初始的哈希桶-服务器映射确定
第一表格是否是待重新分配的。所述方法还包括:当第一表格是待重新分配的,启动第一事
务;执行所述第一事务,其中,所述第一事务包括将数据从所述初始服务器的一个初始服务
器移动到所述添加的服务器的一个添加的服务器。此外,所述方法包括:在执行所述第一事
务之后提交所述第一事务。
[0007]
本发明一实施例中的计算机包括处理器和非瞬时性计算机可读存储介质,用于存
储所述处理器执行的程序。所述程序包括指令,用于:根据初始服务器的数量和添加的服务
器的数量为大规模并行处理器(massively parallel processing,简称MPP)数据库集群确
定更新的哈希桶-服务器映射;根据所述更新的哈希桶-服务器映射和初始的哈希桶-服务
说 明 书
1/9 页
3
相关文档
评论