暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
O
OLAP数据库
编辑
简介:OLAP(Online Analytical Processing)数据库也称分析型数据库,是指一类支持对大规模数据进行较为复杂的联机分析处理的数据库,更关注复杂查询和聚集分析。
简介:OLAP(Online Analytical Processing)数据库也称分析型数据库,是指一类支持对大规模数据进行较为复杂的联机分析处理的数据库,更关注复杂查询和聚集分析。
产品概览 用户评价

目录

OLAP数据库定义

OLAP(Online Analytical Processing)数据库也称分析型数据库,是指一类支持对大规模数据进行较为复杂的联机分析处理的数据库,更关注复杂查询和聚集分析。

OLAP数据库特性

  1. OLAP系统通常并发不高,每个查询会运行较长时间,操作的数据量巨大。

  2. 分析中的查询,大多只需读取数据,不会对历史数据轻易修改。

  3. 分析中的关系代数操作,会包含非常复杂的交运算,中间结果可能种类繁多数量庞大,但 最终返回给用户的结果可能较小较容易理解。

  4. 分析查询面向某一主题的数据,尝试从集成数据中发掘新知识,所以可能执行分析查询前,用户自身对结果的情况也是未知的。

OLAP数据库评测标准

  • TPC-H:TPC-H基准模拟商务采购应用,其数据库模式包含8张表,分别代表参与商业领域中 采购和订购的对象或行为。性能评测基准定义了22个复杂查询语句和2个更新数据语句。 数据 库的规模由标度因子决定,从1GB到100TB不等。 TPC-H基准以每小时内执行的查询数作为度 量标准。

  • TPC-DS:TPC-DS基准定义了3个主要度 量和4个辅助度量,主要度量包括: 1.每小时内执行完毕的查询树,已描述查询吞吐率;2.每小 时内执行的查询数的性价比;3.系统生效日期,及所有在测组件全部生效的日期。

  • JOB: 主要用于连接顺序的选择,对数据库系统的查询效率有重要影响。 在评价数据库对连 接顺序的优化效率时,可以使用JOB(Join Order Benchmark)进行评测。

单机OLAP数据库

单机的计算资源受限,处理庞大数据分析十分困难,对复杂分析更无法应对,因 此OLAP数据库很少单机和集中式架构。

集中OLAP数据库

集中数据库一般采用share storage架构,而OLAP一般是IO和计算密集型操作,这种架构不 适合于OLAP操作,因此OLAP也很少采用集中式架构

分布式OLAP数据库

由于OLAP数据库数据量大,计算量大,因此分布式架构更为合适。分布式OLAP数据库一 般采用全并行无共享架构、向量化执行、编译执行、列式存储来提升计算效率。分布式优化器 通过节点间计算和交互来提升计算并行度。

分布式OLAP数据库业界代表包括TeraData、Greenplum、GaussDB(DWS)、AnalyticDB、 Bigquery、 Clickhouse等。

此外,还有大数据系统支持OLAP功能,例如HIVE、Spark SQl等,它们一般支持海量数 据的离线分析。而OLAP数据库更关注在线分析。

云原生OLAP数据库

云原生OLAP数据库也需要解决计算存储分离、元数据解耦、计算下推问题,从而可以解 决扩容问题,提升了扩容速度。云服务层存储管理计算集群、查询、事务以及所有元数据(如 数据库目录、访问控制信息等)的服务集合底层存储中。 云原生OLAP业界代表包括Redshift、SnowFlake和BigQuery。

云原生OLAP数据库
图片.png

如何鉴别OLAP数据库

由于分析型数据库需要较大算力来支持数据分析,因此分析型数据库主要采用分布式架 构,利用多节点来提升计算性能。

参考资料

文档:数据库系统的分类和评测研究

用户评价

0
0
词条统计
创建者:小小亮
编辑次数:1
浏览次数:14420
API调用次数:0
贡献者