目录
产品介绍
DingoDB(Data In And Go Processing)是九章云极研发的一款开源的分布式、实时多模向量数据库。它融合了数据湖和向量数据库的特点,为存储和分析各种类型的数据提供了完美解决方案。不论是Key-Value、PDF、音频还是视频等数据,DingoDB都能轻松处理。借助DingoDB,您可以便捷地存储、查询和分析多模态数据,无需担心数据复杂性和格式差异的问题。
借助DingoDB,您可以构建自己的Vector Ocean(DataCanvas引入的数据仓库和数据湖之后的下一代数据架构)。使得可以通过单一的SQL界面实时地对结构化和非结构化数据进行分析。
功能简介
DingoDB支持多模态数据的混合存储,并通过提供结构化、非结构化的融合分析能力,实现海量数据的安全存储、分析和语义查询。使其能够高效地管理和检索多模态数据,更好地满足现代化企业对数据存储和管理的多样化需求。同时,提供SQL一体化引擎,实现“服务”“计算”“存储”一体化的数据处理机制,提供更高效、更灵活和一致的数据访问方式,减低开发者门槛。此外,为了保证数据的高可用性和高扩展性,DingoDB多模向量数据库的存储提供多副本机制和多节点扩展机制,充分保障异常情况下知识库的稳定性。
产品价值
DingoDB是一款为应对大规模多模态数据存储和处理分析场景而设计的强大的数据库。它不仅提供了可扩展的海量存储能力,还具备多模态数据融合存储的特性,可以有效地将来自不同模态的数据进行整合和管理。这使得用户能够在一个统一的平台上同时处理、分析和挖掘多种类型的数据。同时,DingoDB还拥有联合分析的服务能力,它能够将来不同数据个数的数据进行集成,为用户提供统一的查询分析接口。这种能力极大地简化了数据整合和集成的复杂性,提高了工作效率。此外,DingoDB在向量检索领域表现出色。它能够解决多种复杂困难问题,例如相似性搜索、聚类分析和推荐系统等。通过利用高效的向量表示和优化算法,DingoDB能够快速、准确地检索和匹配大规模向量数据,为用户提供精确的查询结果和个性化的推荐服务。
总之,DingoDB为解决大规模多模态数据存储和处理分析的场景,提供海量存储、多模态数据融合存储、联合分析的服务能力,将在向量检索方面解决多种复杂困难问题。为用户带来更加优质的数据驱动决策和业务发展。
产品优势
-
统一存储
统一的数据存储能力,通过定义数据模型,灵活地存储各种类型的数据,实现单表存储标量数据与向量数据,使用与不同数据之间的联合查询和分析计算,提供更全面的数据处理能力。 -
多模态检索
基于不同模态数据结构(例如:文本、图像、视频、音频等)联合查询和检索,非结构化数据向量化存储,便于处理非结构化数据。查询时根据查询的数据模态进行相应的特征提取和融合;检索阶段系统通过比较查询特征与存储的多模态之间的相似度或相似性来确定最接近的相关结果。提供更全面和准确的搜索结果、利用多种数据源的相关性、增强用户的搜索体验。 -
联合分析
非结构化数据向量化处理,同时提供标量数据与向量数据的联合分析能力。不同数据类型之间可能存在信息互补性,通过整合不同类型的数据,从而获得更全面、准确的信息,通过综合不同类型的数据进行分析,减少单一数据源的局限性,提高决策和预测的准确性。 -
一体化SQL计算引擎
使用SQL提供强大的结构化、非结构化的联合分析能力,实现多模态数据类型的综合分析。提供对数据的全面查询、分析和计算能力;同时,简化数据分析过程,提高分析师的工作效率,支持更广泛的数据驱动决策和洞察发现。 -
Serving API
支持开发者在多个不同的应用程序之间共享数据、功能和服务,使开发者更容易地实现连接两个应用程序之间的功能,也使开发人员可以更轻松地开发和扩展应用程序。DingoDB还提供多种编程语言和开发框架的SDK(包括Java SDK、Python SDK等),旨在为开发者提供一种安全、稳定、高效的方式集成DingoDB。
系统架构
采用开放式基础架构设计,在数据存储、多模执行引擎、数据接入等方面进行了架构设计,能够快速适配各应用场景的需求。
-
数据存储:DingoDB支持存储结构化数据(关系型存储)和非结构化数据(向量存储),同时具备仓库存储和湖存储的对接能力。对于不同的存储平台,DingoDB具有良好的包容性,并提供了开放式存储引擎接入能力,方便用户轻松对接自己的存储平台。
-
数据分析:DingoDB具备事务性处理和多模态数据分析能力。提供了自定义算子(UDF)的功能,能够满足用户对于处理、分析多种类型数据以及实现个性化开发的需求。
-
数据接入: DingoDB提供丰富的数据接入方式,支持基于SQL的方式通过MySQL客户端连接DingoDB;同时提供Java SDK、Python SDK,实现高频计算和向量计算的能力。
技术优势
-
全方位数据存储
DingoDB支持存储多种数据类型,包括结构化数据与非结构化数据。 -
智能执行引擎
支持一套协议下的多模态SQL优化引擎。 -
混合搜索机制
支持混合搜索机制,结合向量搜索与元数据搜索。 -
存算分离
DingoDB在形态上采用一个存储引擎、一个计算引擎。 -
实时索引构建
支持实时数据写入和实时索引构建。 -
统一数据服务
分析服务一体化,支持多模态查询。交互式分析;提供7*24小时的服务能力。
应用场景
-
企业知识库建设
DingoDB旨在为企业知识库提供向量化存储,并与大规模模型相配合。它的目标是帮助构建智能化的知识库,全面提升知识分享的能力。能够极大地提高员工的工作效率,减少其在搜寻信息方面的时间消耗;支撑政府、传统企业构建企业级的知识库,实现语义的精准搜索与联合分析。 -
大模型记忆体
DingoDB通过分布式存储系统提供可靠且高效的存储解决方案。在辅助大模型生成前进行Prompt管理,Prompt负责存储和组织各种用户输入,一边在查询是能快速检索相关Prompt作为输入。通过大模型记忆体的辅助,可以提升查询响应速度、用户体验和答案生成效率,同时满足大模型应用场景下的查询需求。 -
Vector Ocean数据支撑平台
DingoDB作为一个功能强大的数据存储平台,它能够存储、分析结构化和非结构化数据,并提供可靠的访问和查询接口,提升查询效率。同时具备多模态数据分析和科学计算的能力,能够处理多模态数据,提供丰富的分析算法探索和挖掘数据中的信息,支持各种复杂数据的分析任务和应用场景。 -
实时决策指标计算能力
DingoDB 具备高性能和低延迟的特性,使用户能够在秒级时间内处理和分析大规模数据,并支持实时风控决策。它采用数据复制和故障转移机制,提供高可用性,同时通过持久化技术确保数据不丢失。此外,DingoDB还支持根据业务需求进行计算资源和存储资源的水平扩展,以满足不断增长的数据处理需求。满足信创标准的高频Serving计算能力,支撑实时风控、营销、推荐等要求亚秒级决策能力。 -
结构化与非结构化的融合分析
DingoDB支持处理包括音频、视频、文本等非结构化多种数据类型,并将它们向量化存储,从而更便捷地进行联合分析和科学计算。这种融合分析能力使得用户可以同时利用结构化数据和向量数据,从不同维度和深度挖掘数据中的潜在信息和价值。结构化与非结构化的融合分析可以应用于风险预测舆情监测、智能客服、图像识别等多个场景。例如:在金融行业,可以将结构化财务数据与非结构化的新闻报道等进行融合分析,以检测市场动向和风险变化。
所属公司
北京九章云极科技有限公司(简称九章云极DataCanvas)2013年成立,专注数据科学自动化平台的持续开发与建设,着重为数据科学家,AI从业者提供一整套开发平台,为政府和企业智能化升级和转型提供全面配套服务。九章云极以自主研发的“硬科技”立身,守正出新,以自主研发的标准化AI基础架构软件为基石,通过将AI技术从研发到生产化过程中各个环节“自动化”,不断开创各行各业新业务新场景的领先应用。
相关资料
DingoDB 官网:https://www.dingodb.com/#/home
DingoDB 官方文档:https://www.dingodb.com/jswd
DingoDB GitHub地址:https://github.com/dingodb/dingo