原文作者:MongoDB 总裁兼首席执行官 Dev Ittycheria
原文地址:https://www.mongodb.com/blog/post/redefining-database-ai-why-mongodb-acquired-voyage-ai?tck=promo_banner
人工智能正在重塑行业,重新定义客户体验,并改变企业的创新、运营和竞争方式。虽然大部分焦点都集中在前沿模型上,但一个根本挑战在于数据——如何存储、检索和利用数据来为人工智能应用服务。人工智能软件的民主化取决于在正确的抽象之上构建,但如今,对于大多数组织来说,大规模创建有用的实时人工智能应用是不切实际的。
挑战不仅仅是复杂性,还有信任。人工智能模型是概率性的,这意味着它们的输出不是确定性的和可预测的。这在当今聊天机器人的幻觉问题中显而易见,随着代理的兴起,人工智能系统做出自主决策,这一点变得更加关键。开发团队需要能够控制、塑造和确定生成的输出,以符合他们的目标并确保准确性。
人工智能搜索和检索是一种强大的工具,可以从特定来源提取相关的上下文数据,增强人工智能模型以生成可靠而准确的响应或采取负责任和安全的行动,正如著名的检索增强生成 (RAG) 方法所见。人工智能检索的核心是嵌入生成和重新排名——这两个关键的人工智能组件可以捕获数据的语义含义并评估查询和结果的相关性。我们认为嵌入生成和重新排名以及人工智能搜索都属于数据库层,可以简化堆栈并为人工智能应用程序创建更可靠的基础。通过为数据库带来更多智能,我们帮助企业减轻幻觉,提高可信度,并大规模释放人工智能的全部潜力。
最具影响力的应用程序需要灵活、智能且可扩展的数据基础。因此,我们很高兴宣布收购Voyage AI,该公司是嵌入和重新排序模型领域的领导者,通过 AI 驱动的搜索和检索显著提高准确性。这一举措不仅仅是为了增加 AI 功能,而是为 AI 时代重新定义数据库。
为什么这很重要:人工智能的未来建立在更好的数据相关性和准确性之上
AI 是概率性的——它不像传统软件那样具有预定义的规则和逻辑。相反,它根据 AI 模型的训练方式和检索的数据生成响应或采取行动。然而,由于该技术的概率性质,AI 可能会产生幻觉。幻觉是检索不佳或不精确的直接后果——当 AI 无法访问正确的数据时,它会生成看似合理但不正确的信息。这是 AI 采用的一个关键障碍,尤其是在企业和任务关键型用例中,准确性是不可妥协的。
这使得检索最相关的数据对于 AI 应用程序提供高质量、上下文准确的结果至关重要。如今,开发人员依靠各种独立组件来构建 AI 驱动的应用程序。这些组件的次优选择(例如嵌入模型)可能导致数据检索相关性低和生成输出质量低下。这种分散的方法对开发人员来说既复杂又昂贵,效率低下,而且繁琐。
借助 Voyage AI,MongoDB 通过将 AI 驱动的搜索和检索功能原生到数据库来解决这一挑战。开发人员无需实施变通方法或管理单独的系统,而是可以从实时操作数据中生成高质量的嵌入、存储向量、执行语义搜索并优化结果 - 所有这些都在 MongoDB 中完成。这消除了复杂性,并提供了更高的准确性、更低的延迟和简化的开发人员体验。
在 MongoDB 和 Voyage AI 之前和之后构建 AI 驱动的应用程序。
Voyage AI 为 MongoDB 带来了什么
Voyage AI 已组建了一支世界一流的人工智能研究团队,其研究团队来自斯坦福大学、麻省理工学院、加州大学伯克利分校和普林斯顿大学,并迅速成为高精度人工智能检索领域的领导者。他们的技术已经受到一些最先进的人工智能初创公司的信任,包括 Anthropic、LangChain、Harvey 和 Replit。
值得注意的是,Voyage AI 的嵌入模型是 Hugging Face 社区中评价最高的零样本模型。Voyage AI 的模型旨在通过以下方式提高生成输出的质量:
通过创建嵌入来增强向量搜索,从而更好地捕捉文本、图像、PDF 和结构化数据中的含义。
通过先进的重新排名模型来提高检索准确性,从而优化人工智能应用程序的搜索结果。
通过针对金融服务、医疗保健和法律等不同行业以及代码生成等用例优化的微调模型来实现特定领域的人工智能。
通过将 Voyage AI 的检索功能集成到 MongoDB 中,我们可以帮助组织更轻松地构建更准确、更可靠的 AI 应用程序,而不会产生不必要的复杂性。
Voyage AI 将如何集成到 MongoDB
我们将分三个阶段将 Voyage AI 与 MongoDB 集成。在第一阶段,Voyage AI 的文本嵌入、多模式嵌入和重新排名模型将通过 Voyage AI 当前的 API 以及 AWS 和 Azure Marketplaces 广泛提供,确保开发人员可以继续使用其一流的嵌入和重新排名功能。我们还将投资于平台的可扩展性和企业就绪性,以支持 Voyage AI 模型的广泛采用。
接下来,我们将把 Voyage AI 的功能无缝嵌入到MongoDB Atlas中,首先是 Vector Search 的自动嵌入服务,它将自动处理嵌入生成。随后将推出原生重新排名功能,让开发人员能够立即提高检索准确性。我们还计划扩展特定领域的 AI 功能,以更好地支持不同的行业(例如金融服务、法律等)或用例(例如代码生成)。
最后,我们将通过增强的多模式功能来推进 AI 检索,实现文本、图像和视频的无缝检索和排名。我们还计划引入指令调整模型,让开发人员能够使用简单的提示而不是复杂的微调来优化搜索行为。这将通过在 MongoDB Atlas 中嵌入生命周期管理来补充,确保 AI 应用程序的持续更新和实时优化。
这对开发者和企业意味着什么
人工智能驱动的应用程序需要的不仅仅是一个存储、处理和保存数据的数据库,它们还需要一个能够积极提高检索准确性、无缝扩展和消除操作摩擦的数据库。借助 Voyage AI,MongoDB 重新定义了数据库支持任务关键型人工智能驱动应用程序所需的条件。
开发人员将不再需要管理外部嵌入 API、独立向量存储或复杂的搜索管道。AI 检索将内置于数据库本身,使语义搜索、向量检索和排名与传统查询一样无缝衔接。
对于企业而言,这意味着更快的价值实现速度和对扩展 AI 应用的信心。通过大规模提供高质量的结果,企业可以将 AI 无缝集成到其最关键的用例中,确保可靠性、性能和实际影响。
展望未来:接下来会发生什么
这仅仅是个开始。我们的愿景是让 MongoDB 成为现代 AI 驱动应用程序最强大、最直观的数据库。
Voyage AI 的模型很快将在 MongoDB Atlas 中原生提供。
我们将继续发展 MongoDB 的 AI 检索功能,使其更加智能、适应性更强,能够处理更广泛的数据类型和用例。




