暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【技术分享】GaussDB 200数据库架构介绍

 

郭富杰

数据技术处

GaussDB 200是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供PB(Petabyte)级数据分析能力、多模分析能力和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载(HTAP)等场景,广泛应用于金融、政府、电信等行业核心系统。


GaussDB 200采用MPP(Massively Parallel Processing)架构,在核心技术上跟传统数据库相比有巨大优势,可以解决很多行业用户的数据处理性能问题,可以为超大规模数据管理提供高性价比的通用计算平台,并可用于支撑各类数据仓库系统、BI(Business Intelligence)系统和决策支持系统,统一为上层应用的决策分析等提供服务。


GaussDB 200采用Share-nothing架构,由多个拥有独立且互不共享CPU、内存、存储等系统资源的节点组成。在这样的系统架构中,业务数据被分散存储在多个物理节点上,数据分析任务被推送到数据所在位置就近执行,通过控制模块的协调,并行地完成大规模的数据处理工作,实现对数据处理的快速响应。


Share-nothing又称为无共享架构,Share-nothing架构具备易于扩展、内部自动并行处理,无需人工分区或优化,提供最优化的I/O处理性能,增加节点可实现存储、查询及加载性能的线性扩展的优点,和其他架构的对比如图一所示。

 图一 架构对比图


GaussDB 200由多个MPPDBServer组成,GaussDB 200逻辑架构如图二所示。

图二 GaussDB 200逻辑架构图


CM(Cluster Manager):即含CMServer进程的特殊MPPDBServer,负责管理和监控分布式系统中各个功能单元和物理资源的运行情况,确保整个系统的稳定运行,分为主CM和备CM。

MPPDBServer(GTM):全局事务管理模块GTM,虽然是分布式数据库,同样具备关系型数据原本的ACID特性,可灵活实现表级锁和行级锁控制功能。
业务模块:即除MPPDBServer(CM)、MPPDBServer(GTM)以外的MPPDBServer,由Coordinator及多个Datanode组成。
 Coordinator(CN):负责提供外部应用接口、优化全局执行计划、向Datanode分发执行计划,以及汇总、处理执行结果。

Datanode(DN):在集群中,DN有多个,每个DN存储了一部分数据。如果DN无高可用方案,则故障时会导致该实例上的数据无法访问。因此GaussDB 200对DN提供了高可用方案:主、备、从备。

本文来源:公众号“I生活T精彩”


你“在看”我吗

文章转载自中国光大银行科技创新实验室,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论