一、GBase 8a介绍
1、GBase 8a MPP Cluster,全称“南大通用大规模分布式并行数据库集群系统”。
2、特性
- 高性能
- 高可用
- 高扩展
3、主要应用系统
- 数据仓库系统
- 商业智能系统
- 决策支持系统
4、所属类型
GBase 8a集群数据库属于NewSQL分析型数据库,针对海量数据查询和关联分析,课程中以银行架构为例介绍了数据架构。
二、核心技术
从六大方面展开介绍了GBase 8a MPP Cluster的核心技术,包括数据存储、并行计算、集群高可用、数据集成、集群扩展和安全管理。
三、架构演进
1、GBase 8a MPP Cluster从最初的单机列式存储数据库到MPP集群架构,再到现在的MPP超大规模集群,实现了从单机到集群的架构演进。下面介绍GBase 8a MPP超大规模集群中的V86和V95版本。
(1)V86版本
- 实现了联邦架构,即管理节点和数据节点分离
- 优化数据分布,包括hash分布、随机分布
- 支持多分片存储,实现高效扩容
- 集群规模实现PB级存储
(2)V95版本 - 在V86版本基础上新增虚拟集群的概念
- 支持集群镜像功能,实现实时备份和存算分离
- 能够兼容单集群和低版本升级
- 集群规模大
2、虚拟集群物理架构
(1)统一Coordinator Cluster:实现跨业务关联访问和操作,包括跨业务数据访问和用户权限管理
(2)VC(Virtual Cluster):实现单个业务的独立管理,包括数据管理,用户管理和集群版本管理
(3)Free Nodes(闲置节点):实现多个业务之间的资源共享以及合理调配
3、虚拟集群逻辑架构
(1)统一接口层
为上层应用SQL提供标准JDBC、ODBC、ADO.Net、CAPI访问接口
(2)GCluster
负责SQL的解析和优化,分布式执行计划生成、执行调度
(3)GCWare
用于各节点GCluster实例间共享信息,提供可操作节点及控制各节点数据一致性状态
(4)GNode
GCluster中最基本的存储和计算单元,负责集群数据在节点上的实际存储,并从GCluster接收和执行经分解的SQL执行计划,执行结果返回给GCluster
4、虚拟集群网络架构
按功能分为数据网络(集群内部网络)和业务网络(集群外部网络),两个网络之间物理隔离。
每个coordinator节点需要配置业务网络和数据网络,并且数据网络必须属于同一IP网段。
每个data节点只接入数据网络,数据网络可跨IP网段。