一种通用的实时查询引擎
技术领域
[0001]
本发明涉及数仓技术领域,具体为一种通用的实时查询引擎。
背景技术
[0002]
数仓是数据仓库的简称。它是一个面向主题的、集成的、相对稳定的、反映历史变
化的数据集合,用于支持管理决策。不同于传统数据库对应于某一个或多个项目,数据仓库
根据使用者实际需求,将不同数据源的数据在一个较高的抽象层次上做整合,所有数据都
围绕某一主题来组织。数据仓库中存储的数据是来源于多个数据源的集成,原始数据来自
不同的数据源,存储方式各不相同。数据仓库中保存的数据是一系列历史快照,不允许被修
改,用户只能通过分析工具进行查询和分析。数据仓库会定期接收新的集成数据,反应出最
新的数据变化。
[0003]
在数仓领域中,写入数据后需要经过一系列复杂的数据处理后,才可以对数据进
行查询,该过程需要较长的时间,即新写入的数据不能实时可查,数据的延时不利于对数据
进行实时追踪,也不能及时的了解到数据的变化,因此需要一种实时查询引擎,用于让新写
入的数据实时可查。
发明内容
[0004]
本发明的目的在于提供一种通用的实时查询引擎,以解决上述背景技术中提出的
目前数仓领域无法做到新写入的数据实时可查的问题。
[0005]
为实现上述目的,本发明提供如下技术方案:一种通用的实时查询引擎,包括注册
模块、数据接入模块、查询模块、数据清理模块以及FoundationDB;
[0006]
所述注册模块,用于在FoundationDB上建立表格以及注册索引,表格用于辅助数
据的导入以及查询,索引用于调用FoundationDB的查询能力;
[0007]
所述数据接入模块,用于录入数据以及提供插件扩展机制,插件扩展机制可以通
过插件提取不同格式的数据,最后将录入的数据及提取的数据写入FoundationDB的表格
中;
[0008]
所 述 查 询 模 块 ,用 于 通 过 索 引 调 用 F o u n d a t i o n D B 的 查 询 能 力 ,然 后 对
FoundationDB的表格中的数据进行快速查询;
[0009]
所述数据清理模块,用于分析FoundationDB的表格中的数据是否过期,并对表格
中过期数据进行清理。
[0010]
优选的 ,所述注册模块还包括时间添加模块 ,所述时间添加模块 用于为导入
FoundationDB的表格中的数据添加操作时间,操作时间也会录入在FoundationDB的表格
中。
[0011]
优选的,所述数据清理模块还包括时间设定模块,所述时间设定模块用于设定过
期数据的具体时间,当数据的操作时间超过过期数据的具体时间时,该数据即为过期数据。
[0012]
优选的,所述查询模块在查询时,也可以FoundationDB的表格中的数据的操作时
说 明 书
1/3 页
3
文档被以下合辑收录
相关文档
评论