目录
产品简介
Apache Druid是一个开源的分布式实时分析数据库,专为商业智能(OLAP)查询流数据和历史数据而设计。它对时间序列扫描和聚合进行了优化。它支持从深层存储系统(如HDFS)和流源(如Kafka)加载数据。在内部,Druid使用Zookeeper来协调集群节点,使用MySQL或Postgres这样的关系数据库来跟踪元数据,使用HDFS这样的深层存储系统来存储数据。德鲁伊在事件创建和查询之间的延迟也很低,这使得德鲁伊能够进行实时分析。德鲁伊以一种称为段的独特格式存储传入的数据,以允许对任意维度的数据进行快速聚合。德鲁伊通常通过JDBC支持基于gui的分析性BI应用,并通过REST API作为AI应用的后端。德鲁伊还用于点击流分析、网络遥测分析、应用性能分析、广告分析。
发展历史
Druid最初是由Metamarkets的工程师开发的,旨在解决实时分析高维数据集的问题。在传统关系数据库中扫描和聚合数十亿条记录的速度不够快,而使用NoSQL架构进行预计算聚合需要难以接受的长处理时间,这在事件发生和查询可用性之间造成了很高的延迟。德鲁伊于2011年4月发布,旨在解决对高维时间序列数据的快速、实时分析的需求。它于2012年10月开放,目前正在积极开发中。
所属公司
Apache软件基金会
相关资料
官网:https://druid.apache.org
用户评价
0
0
词条统计
创建者:墨天轮福利君
编辑次数:0
浏览次数:1500
API调用次数:0
贡献者