暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
GBase 8a
标签
编辑
简介:分布式逻辑数据仓库GBase 8a是GBASE南大通用公司自主研发的、面向海量数据查询分析应用领域的一款高性能国产新型数据库产品,用于满足各个数据密集型行业日益增大的数据查询、数据统计、数据分析、数据挖掘和数据备份等数据存储、管理和处理需求,可用做数据仓库系统、BI系统和决策支持系统的承载数据库。
简介:分布式逻辑数据仓库GBase 8a是GBASE南大通用公司自主研发的、面向海量数据查询分析应用领域的一款高性能国产新型数据库产品,用于满足各个数据密集型行业日益增大的数据查询、数据统计、数据分析、数据挖掘和数据备份等数据存储、管理和处理需求,可用做数据仓库系统、BI系统和决策支持系统的承载数据库。
产品概览 用户评价

目录

产品简介

分布式逻辑数据仓库GBase 8a是GBASE南大通用公司自主研发的、面向海量数据查询分析应用领域的一款高性能国产新型数据库产品,用于满足各个数据密集型行业日益增大的数据查询、数据统计、数据分析、数据挖掘和数据备份等数据存储、管理和处理需求,可用做数据仓库系统、BI系统和决策支持系统的承载数据库。

图片.png

核心价值

  • 存算分离:支持部署多VC(虚拟子集群),为OLAP提供不同的计算能力,并且支持单独扩展计算能力;支持使用分布式存储持久化数据文件,可独立扩展存储。
  • 多实例:支持单节点的多实例部署,充分利用NUMA架构服务器的计算能力提供极致的查询性能。
  • 向量化引擎:提供向量化运算能力,有效提升数据的运算效率,提升查询性能。
  • 多租户:提供多租户能力,支持多租户间的物理隔离、逻辑隔离等多种方式。
  • 算法融合:支持关系算法(SQL)、非关系算法(NoSQL、图、机器学习等)。
  • HTAP:实时交易处理使用OLTP数据库,交易数据实时同步到GBase 8a完成实时数据分析。

产品架构

图片.png

技术特性

南大通用自主研发的GBase 8a MPP Cluster是大数据时代成熟的分析型 MPP 数据库。具有联邦构架、海量数据分布式、高效压缩、高效存储结构、智能索引、灵活的数据分布、在线高性能扩展、高并发、高可用、高安全性、易维护、高效加载等核心优势,具体如下:

  1. 适配平台:支持金蝶、东方通等主流中间件;支持曙光、浪潮、华三、长城、联想等主流国产服务器;支持海光、鲲鹏、飞腾、申威、龙芯、兆芯等主流的国产处理器;支持中标麒麟、银河麒麟、中科方德、统信等主流的国产操作系统。

  2. 编码格式:支持多种编码格式,如UTF-8、UTF8-MB4、GBK 、GB18030、Unicode编码格式,支持多语种。

  3. 海量数据高效存储:单个集群可处理15PB以上的结构化数据,采用HASH或RANDOM分布策略进行数据分布式存储;单数据节点可处理50TB以上裸数据数据量,且所有节点无共享,具有对等计算能力;同时单表支持247(万亿级)行级数据量。

  4. 大规模并行计算:针对数据加载和数据查询实现了自动高效的并行处理技术,充分利用SMP多核CPU资源并行处理海量数据。利用单节点并行技术,结合MPP集群跨节点并行,对算子进行分布式并行计算处理,可实现数据查询分析的超大规模分布式并行处理和多数据源并行加载。

  5. 数据高可用:通过冗余机制来保证集群的高可用特性,互备分片间可实现数据自动同步。体现了集群环境中节点内及跨节点的并行处理能力。

  6. Hash索引:利用Hash索引提高等值查询的定位效率,针对集群内单表精确查询可实现秒级查询响应。

  7. 智能索引:采用高性能、免维护的粗粒度智能索引技术,索引建立膨胀率不超过百分之一。智能索引包含基于列的统计信息,在数据检索定位时可被直接使用,有效过滤数据,大幅降低数据库磁盘I/O,大幅提高海量数据的查询性能;在亿级数据规模下,可达到集群单节点单表基于时间列精确查询秒级响应能力。

  8. 备份恢复管理:提供专用的备份恢复工具,支持物理备份恢复(完全、增量、差异)和逻辑备份恢复(实例级、用户级、表级),方便用户在不同应用场景下自主选择备份恢复策略。

  9. 数据加密:具备透明的数据加密功能,数据加密实现表级或者列级不同粒度的加密要求,支持数据存储加密,支持数据库密码加密,支持数据加密压缩;支持相关加密函数,如AES_ENCRYPT()、ENCRYPT()、MD5()、SHA1()、SHA()等;支持备份软件进行备份文件加密。

  10. 核心进程级别高可用技术:GNode,GCluster,GCware 等核心进程被实时监控,出故障后可及时恢复。具备完善的数据库物理恢复功能,支持系统故障恢复、完全介质故障恢复、网络故障恢复、基于表空间/文件组的介质故障的数据库物理恢复功能;具有完全恢复模式和指定时间点恢复模式,可将数据恢复到崩溃时间点数据或指定时间点数据。

关键指标

• 真正的列存储,数据压缩比最高可达1:30
• 自动提供粗粒度智能索引,高效过滤,膨胀小,免维护
• 可支撑20TB级别的结构化数据
• 支持并行计算,充分利用现代的 SMP 多核 CPU 资源
• 数据加载速度可达到200GB/小时

适用场景

GBase 8a MPP Cluster适用于TB级~百PB级数据的查询分析场景,包括电信、金融、政企、安全、能源、交通、工业、农业、气象、环境、医疗等行业的海量数据应用:

  • 海量数据仓库,数据集市
  • 大数据深度分析平台
  • 历史库存储和查询
  • 大数据开放平台
  • 数据交换平台

产品FAQ

Q: GBase 8a能干什么?
A:GBase 8a能够实现大数据的全数据(结构化数据、半结构化数据和非结构化数据)存储管理和高效分析,为行业大数据应用提供完整的数据库解决方案。 
Q:GBase 8a的水平如何? 
A:GBase 8a能够在百TB至PB级数据规模下实现数据查询的秒级响应;能够帮助客户节省50%-90%存储空间;能够为客户节省50%-90%的投资和运维成本;能够对结构化、半结构化和非结构化数据进行统一处理;能够实现千亿级文本条目全文检索的秒级响应;能够提供全过程可视化的数据查询分析及展现工具。
Q:GBase 8a目前有什么成功案例?
A:GBase 8a已经在电信、金融和政务等领域取得规模化市场应用,主要包括中国移动、中国联通、中国电信、银监会、公安部、安全部、工信部、国税总局、国家海洋局、中国石油等。
Q:GBase 8a在项目中的测试情况如何? 
A:参加了150多次用户现场测试:中国移动集团下一代数据仓库选型测试前三名,是唯一入围的国产产品;在公安部、招商银行、新疆移动、吉林移动、中兴通讯、用友软件等单位的项目测试中取得了优异的成绩,获得用户的一致好评。

所属公司

天津南大通用数据技术股份有限公司(简称:GBASE)成立于2004年,注册资金1.6亿元,现有员工650人,公司自成立以来始终坚持自主创新,产品的核心技术及底层代码自主可控,构建了覆盖数据管理全生命周期,包括分析型、事务型、分布式事务型、云原生数据仓库等全技术栈的数据产品体系及服务解决方案。

相关资料

GBase 8a 官网:http://www.gbase.cn/index.html
《GBase 8a MPP Cluster技术白皮书_V9》

用户评价

0
0
词条统计
创建者:小小亮
编辑次数:3
浏览次数:4617
API调用次数:0
贡献者
2023/03/06
2023/03/06