随着业务数据量不断增长的同时,数据结构也变得越来越灵活多样,数据不再局限于规整的结构化数据,半结构化、非结构化数据在数据域处理中的占比逐年上升,因此对不同模态的数据进行智能化数据处理的需求越来越迫切。
中国信通院在《数据库发展研究报告(2021年)》中指出,在后关系型数据库阶段,数据结构越来越灵活多样、业务类型越来越复杂多变,为应对此类现状,越来越多的用户选择通过多模型数据库实现“一库多用“,将各种类型的数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据的统一管理需求。此外,中国信通院在《数据库发展研究报告(2022年)》中再次将多模数据管理列为九大数据库关键技术之一,报告中指出,随着理论创新和技术突破,以及新场景、新应用的不断涌现,数据库经历了层次、网状、关系、对象、键值、文档、图等数据模型的发展,当前多模数据管理得到广泛关注。
图1:多模数据库发展历程
Gartner对多模数据库的定义如下,多模数据库是指在一个数据库管理系统中包含了多个数据引擎,关系型和/或非关系型(例如文档、图、键值、时序、宽列)。它们为不同的持久性类型提供了一种通用的访问机制,每种持久性类型都针对所使用的数据的性质进行了优化。在2022年Gartner发布了《中国数据库管理系统供应商甄选》,列举了中国数据库市场的48位供应商候选名单,并将每个厂商的产品按照关系型和非关系型/多模两大类8个细分子类进行归类,帮助中国市场企业用户更全面地了解各厂商及其产品情况。在多模数据库领域,星环科技ArgoDB、阿里云Lindorm、武汉达梦DMCDB、巨杉数据库SequoiaCM四款产品上榜。
多模数据库支持灵活的数据存储类型,将各种类型的数据进行集中存储、查询和处理,可以同时满足应用程序对于结构化、半结构化和非结构化数据的统一管理需求,大幅度简化运维,节省开发成本。
国外比较有代表性的多模数据库主要是以文档存储为主的 MarkLogic、ArangoDB、Cosmos DB 等,国内也逐渐涌现选择多模技术路线的数据库产品,如上面提到的星环科技 ArgoDB,基于多模型统一架构,实现了多模数据库的“四个统一”:统一的SQL编译引擎、统一的计算引擎、统一的存储管理系统和统一的资源管理,支持关系型存储,宽表存储、搜索引擎、事件存储、图存储、键值存储、时序数据存储等10种数据模型,满足多种数据模型处理场景和复杂业务需求。
例如在反欺诈场景中,传统反欺诈解决方案由于不同数据模型分散存储在不同的数据库(例如关系型数据库和图数据库)等原因,在实际业务中需要大量数据转换操作,应用实施成本高,实时性有待提高。ArgoDB 可将关系型数据和图数据库进行统一存储,用户只需通过一个SQL即可关联查询分析关系型数据和图数据,在数据免搬迁、减少人工操作的同时,提升业务效率。
图2:星环科技ArgoDB与传统跨模型分析应用方案对比