暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
笛卡尔(Descartes)
编辑
厂商:零一万物
超高精度、 超高性能
简介:笛卡尔(Descartes)是零一万物公司推出的基于全导航图的新型高性能向量数据库。通过全栈向量技术的加持,零一万物笛卡尔向量数据库不仅登顶权威榜单 ANN-Benchmarks6 项评测第一名。更在实际应用场景中具有精度更高、性能更强等核心优势。零一万物笛卡尔向量数据库在处理复杂查询、提高检索效率以及优化数据存储方面相比业界拥有显著的比较优势。
简介:笛卡尔(Descartes)是零一万物公司推出的基于全导航图的新型高性能向量数据库。通过全栈向量技术的加持,零一万物笛卡尔向量数据库不仅登顶权威榜单 ANN-Benchmarks6 项评测第一名。更在实际应用场景中具有精度更高、性能更强等核心优势。零一万物笛卡尔向量数据库在处理复杂查询、提高检索效率以及优化数据存储方面相比业界拥有显著的比较优势。
产品概览 基本属性7 其他特性1 厂商7 用户评价

目录

产品简介

笛卡尔(Descartes)是零一万物公司推出的基于全导航图的新型高性能向量数据库。通过全栈向量技术的加持,零一万物笛卡尔向量数据库不仅登顶权威榜单 ANN-Benchmarks6 项评测第一名。更在实际应用场景中具有精度更高、性能更强等核心优势。

高性能向量数据库通常是指向量数据集规模在千万级及以下(如 2000 万 128 维浮点型向量),通常而言,高性能向量数据库可以轻松应对百分之八九十的日常场景,比如帮助企业客户构建私域知识库、智能客服系统;在自动驾驶领域,使用高性能向量数据库可来加速自动驾驶模型训练等。

产品优势

零一万物笛卡尔向量数据库在处理复杂查询、提高检索效率以及优化数据存储方面相比业界拥有显著的比较优势。

零一万物高性能向量数据库具有以下优点:

  • 超高精度:基于多层缩略图和坐标系实现层间导航和图上方位导航,以及图连通性保障,实现精度大于 99%,相同性能下,精度大幅领先业内水平。

  • 超高性能:高效的边选择和裁剪技术,千万数据库 ms 响应。

以电商推荐场景为例,上架商品数量可能千万级,每个商品可以由一个向量表达。即使库中向量数不算很大,如果电商用户基数非常庞大,高峰时每秒用户请求数非常大,可能达到几十万甚至上百万的 QPS。使用高性能向量数据库可以有效提升电商场景里面搜索、广告业务的推荐效果,让大家忍不住一直买买买。

技术特点

众所周知,RAG 是一种结合了检索和生成的技术,它通过从海量数据中检索查询到的信息,来增强语言模型的生成能力。和传统检索方法类似,从本质上讲,RAG 向量检索主要解决两大问题:

  1. 通过建立某种索引结构,减少检索考察的候选集;
  2. 降低单个向量计算的复杂度。

零一万物笛卡尔向量数据库在处理复杂查询、提高检索效率以及优化数据存储方面相比业界拥有显著的比较优势。针对第 1 个问题,零一万物团队有两大杀手锏:

  • 领先的全导航图技术。目前业内现状主要通过哈希、KD-Tree、VP-Tree 等方式,导航效果不够精确,裁剪力度不够,零一万物研发的全局多层缩略图导航技术,图上坐标系导航,既能保证精度,又能裁剪大量无关向量。

  • 首创自适应邻居选择策略,填补业界空白。零一万物自研的自适应邻居选择策略,突破了以往仅依赖真实 topk 或固定边选择策略的局限,新策略使每个节点可以根据自身及邻居的分布特征动态地选取最佳邻居边,更快收敛接近目标向量,从而让 RAG 向量检索性能提高 15%-30%。

针对第 2 个问题,零一万物采用了两级量化方案增强 RAG。零一万物用两级量化降低计算复杂度,同时列式存储充分利用 SIMD 的并发能力,进一步发挥硬件能力,相比传统 PQ 查表,性能得到大幅提升到 2-3 倍。

除此之外,零一万物还有索引结构优化、连通性保障等全栈向量技术方案提高笛卡尔向量数据库的性能。

发展历程

2024年3月11日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。

ANN-Benchmarks 是当下业界最权威的向量数据库性能测试工具,它可以展示不同算法在不同真实数据集下的表现。在以下 6 份评测数据集涵盖 glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean 六大数据集,横坐标代表召回、纵坐标代表 QPS (每秒内处理的请求数),曲线位置越偏右上角意味着算法性能越好,零一万物笛卡尔向量数据库在 6 项数据集评测中都处于最高位。

在国际权威评测平台 ANN-Benchmarks 离线测试中,零一万物笛卡尔(Descartes)向量数据库登顶 6 份数据集评测第一名,比之前榜单上同业第一名有显著性能提升,部分数据集上的性能提升甚至超过 2 倍以上。

零一万物表示,笛卡尔向量数据库是团队基于 RAG 的初步尝试,笛卡尔向量数据库将用在近期即将正式亮相的 AI 产品中,未来也将结合工具提供给开发者。

所属公司

北京零一万物科技有限公司。零一万物由创新工场和前百度VP马杰创建,是一家AI大模型研发商,致力于自研大模型、自建平台,构建数千卡GPU集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。零一万物致力于成为一家由技术愿景驱动、拥有卓越中国工程底蕴的创新企业,推动以基座大模型为突破的 AI 2.0 掀起技术、平台到应用多个层面的革命。

相关资料

零一万物公司官网:https://www.lingyiwanwu.com/

基本属性
产品名称 笛卡尔(Descartes)
所属国家 中国
slogan 基于全导航图的新型向量数据库
核心特性 超高精度, 超高性能
首发时间 2024-03-11
模型分类 向量
商业模式 商业
其他特性
产品首页 https://www.lingyiwanwu.com/
厂商
厂商 零一万物
官网 https://www.lingyiwanwu.com/
微信公众号 零一万物 01AI
融资阶段 天使轮
市值(亿) 10
总部城市 北京
注册资本(万) 10

用户评价

0
0
词条统计
创建者:小小亮
编辑次数:1
浏览次数:340
API调用次数:0
贡献者
2024/03/13