

前言
毫无疑问,2025年是AI Agent元年。
这个判断,从Deep Research带来搜索新范式,到Manus一夜爆火,再到MCP成为新的接口标准,已经被反复验证。
相比普通AI工具,Agent拥有:
更强的推理能力——在众多推理模型的基础上,Agent不只是执行指令,还会深入思考问题。
丰富的工具运用能力——Agent可以帮助用户连接应用程序编程接口(API)或者控制硬件设备。
更强的信息检索能力——通过与诸如大语言模型(LLM)、Milvus 和 Zilliz Cloud 向量数据库,以及embedding模型等工具集成,它们能够轻松处理海量数据集。
更完整的环境感知能力——Agent能够更充分地理解对话语境或者物理世界中的情境。
一定程度上,Agent的成熟,代表着AI的能力从简单给出答案,到交付完整任务结果的进化。那么有哪些AI Agent值得关注呢?
在这篇文章中,我们将详细介绍 2025 年值得关注的 10 个 AI Agent。
01
Deep Research与DeepSearcher:专业级报告生成
不久前,OpenAI推出了最新的深度内容生成神器“DeepResearch”,用户只需一个"特斯拉的合理市值是多少"的提问,
DeepResearch就能生成一份包括企业财务、业务增长分析,再到最后的市值推演的专业分析报告。
而这,也指明了搜索AGI的发展方向。
在此背景下,如何基于“DeepResearch”理念,对其做定制化改造,成为了近一个月来的市场热门话题。
Zilliz也是其中非常幸运的一员。不久前我们推出了DeepSearcher开源项目 ,一个月时间,在GitHub收获的star数量就已经接近5000!
建立在DeepResearch大模型+超级搜索+研究助理的三合一的基础上,
DeepSearcher还通过Milvus向量数据库引入本地数据,并支持用户自由更换包括DeepSeek-R1在内的底层模型,为用户带来了更符合企业级场景的全新RAG范式。
从架构上看,DeepSearcher 主要分为两大模块。

一个是数据接入模块,通过Milvus向量数据库来接入各种第三方的私有知识。这也是DeepSearcher相比OpenAI的原本DeepResearch做出的一大重大升级——更适合拥有独家数据的企业级场景。
另外一部分是在线推理查询模块。这个模块包括了各种Agent策略以及RAG的实现部分,负责给用户提供准确有深度的回答。
这部分引入了动态循环迭代机制:每次对向量数据库中内容完成数据查询后,系统都会启动一个反馈(reflection)流程,然后在每一轮迭代结束时,智能体(Agent)会对查询到的知识进行评估,判断其是否足以解答初始提出的问题。若发现仍存在知识缺口,便会触发下一轮迭代查询;若判定已有足够知识来作答,系统就会生成最终报告 。
02
Manus:一夜爆火的全能Agent
Manus是由创业公司 Monica 推出的 AI agent,其定位是全球首款通用AI Agent。在今年3月初,一经发布,立刻引发全网热议。根据官方展示案例,Manus可以自主完成简历筛选、房产研究、股票分析等多类型的复杂任务。具备自主思考、规划和执行复杂任务的能力,并直接交付完整成果。
官方数据披露,Manus在GAIA基准测试中取得了SOTA(State-of-the-Art)的成绩,超越OpenAI等同层次大模型。
03
Google Astra:重新定义日常生活中的 AI 助手
Google Astra 是由 DeepMind 开发的 AI Agent,旨在通过多模态功能无缝融入日常生活。该 Agent 由 Gemini 2.0 驱动,能够处理并响应多种输入信息,包括文本、图像、视频和音频。
Astra 的突出特点包括:理解上下文的实时记忆功能、先进的工具使用能力(例如谷歌搜索、谷歌地图和谷歌智能镜头),并协助完成诸如识别物体或提供推荐等任务。例如,用户可以将手机对准书架,然后让 Astra 识别评分最高的书籍,进而将数字世界和物理世界相连接。未来,谷歌计划将其部分功能集成到旗下其他产品中, Astra 有望在 2025 年重新定义个人 AI 助手。
04
微软的 copilot:简化工作流程并提高生产力
微软的 Copilot 是一款集成到许多微软办公平台(如 Office 365 和 Dynamics 365)中的 AI Agent,旨在简化日常任务和工作流程。例如,在 Word 中,Copilot 可以帮助用户起草报告或完善现有文本。在 Excel 中,它能根据自然语言输入生成公式并创建可视化图表。在 Teams 中,Copilot 通过总结会议内容、突出重点并提出行动事项来增强协作效果。
对于开发者而言,Copilot 的功能不仅限于终端用户的任务,它还提供与 Azure 的集成,以实现工作流程自动化和业务流程管理。通过将 AI 嵌入人们日常使用的工具中,微软的 Copilot 简化了重复性工作,使团队能够专注于更复杂和创造性的挑战。
05
ChatGPT Plugins与Operator:将 GPT 的能力拓展到现实世界任务中
ChatGPT 插件将 OpenAI 的 GPT 模型转变为强大的工具,使其能够与外部系统交互,从而执行除文本生成之外的现实世界任务。通过与 Expedia、Wolfram Alpha 和 Zapier 等第三方服务集成,这些插件使 ChatGPT 能够获取实时数据,并实现工作流程自动化,使其更接近成为个人和企业的动态 AI 助手。例如,用户可以让 ChatGPT 预订航班、计算复杂方程。
虽然 ChatGPT 插件并非完全自主的 Agent,但它们通过动态响应提示并利用外部工具来完成任务,实现了类似 Agent 的行为。对于开发者来说,这意味着可以更低成本的构建自己的workflow。
在此之外,OpenAI 还发布了首款AI代理工具Operator(意为操作员),能够代理用户执行基于网页的操作,简单来说,就是Operator能够像人类一样使用网页浏览器。
06
AutoGPT:自主任务执行领域的先驱
AutoGPT 是一个实验性的开源项目,它将 GPT 模型转变为能够在极少人工干预的情况下执行复杂、多步骤任务的自主 Agent。通过利用 GPT-4 的强大能力,AutoGPT 可以将复杂目标分解为更小的、可执行的任务,按顺序执行这些任务,并根据结果进行迭代,以实现预期的结果。这使其成为开发者广泛采用的最早的自主 AI Agent 示例之一。
虽然仍处于早期阶段,AutoGPT 通过展示自主 Agent 的潜力激发了 AI 社区的想象力。开发者们可以通过它的思路,来构建复杂应用程序,比如研究助手、自动化工作流程管理器等。AutoGPT 凸显了 AI Agent 不断增长的趋势,即它们不仅提供答案,还能采取行动,为未来更复杂的自主系统铺平了道路。
07
BabyAGI:用于可扩展解决方案的轻量级任务自动化工具
BabyAGI 是一个轻量级的开源自主 Agent,旨在以迭代和智能的方式执行任务。与 AutoGPT 一样,它由 GPT-4 驱动的。它专注于任务管理和执行,使其成为面向任务的AI 解决方案的强大工具。它的模块化设计允许开发者自定义工作流程,与各种数据库集成,并构建针对特定需求的解决方案。
与仅响应孤立查询的简单大语言模型不同,BabyAGI 会根据一个总体目标创建一个任务队列,对任务进行优先级排序,并逐步完成它们。例如,当收到“研究一个主题并总结研究结果”这样的复杂指令时,BabyAGI 会自主地将其分解为子任务,如收集资源、分析内容和起草连贯的总结。
BabyAGI 与众不同的是其轻量级和可扩展的设计。它可以在不需要大量资源的情况下提供核心 AI 功能,为预算有限的企业提供了一个易于使用的工具。此外,其自适应学习系统会随着用户需求的变化而发展,确保随着时间的推移提供越来越个性化和高效的帮助。最近的更新还引入了增强的协作功能,使 BabyAGI 成为小型团队处理共享项目的优秀工具。
08
甲骨文的 Miracle Agent:面向企业的数据驱动决策的 AI 工具
甲骨文的 Miracle Agent 是一套由 50 多个专门的 AI Agent 组成的工具集,专门针对企业环境,专注于数据库管理。通过深度集成到甲骨文的云生态系统中,Miracle Agent 实现了数据处理和可视化的自动化,使公司能够在极少人工干预的情况下获得洞察。
例如,Shift Scheduling 助手可以帮助创建和管理员工的轮班时间表,同时考虑个人偏好和合规规定。Employee Hiring Advisor 可以协助寻找候选人并简化招聘流程,缩短招聘时间。在供应链管理方面,Customer Sales Representative Guide 可以提供个性化的洞察,以增强客户互动。
09
MultiOn Agent API:为开发者简化网页自动化
MultiOn Agent API 是一个面向开发者的平台,它允许将 AI Agent 集成到各种应用程序和设备中,实现基于网页的任务自动化并提升用户体验。Agent API 于 2024 年 4 月推出公测版,允许开发者创建能够在网页上执行复杂操作的 AI Agent,例如浏览网站、提取数据和完成在线交易。
Agent API 支持 Python 和 JavaScript 软件开发工具包(SDK),便于与 LangChain 和 LlamaIndex 等流行的大语言模型框架无缝集成。这种灵活性使开发者能够构建自定义的 AI 应用程序,比如浏览、抓取和操作网页内容。
10
亚马逊的 Bedrock Agents:用于企业工作流程的智能自动化工具
亚马逊的 Bedrock Agents 是 AWS 为构建 AI 驱动的解决方案而推出的最新产品,可以将AWS内的基础模型与各种工具和数据中相结合。
Bedrock Agents 的实用性在于其灵活性。无论开发用于客户支持的聊天机器人、自动化后端工作流程,还是构建推荐系统都很适用。另外,这些 Agent 还内置了对各种API的支持,使其易于连接到现有的技术栈。此外,由于 Bedrock 是Serverless 的,无需担心应用扩展的问题。
向量数据库:Agent 长期记忆的支柱
像 AutoGPT、Google Astra 以及本文中列出的其他 AI Agent,它们不仅仅能处理数据,还能以近乎人类的方式进行分析、推理和决策。
然而,就像人类一样,Agent 需要可靠的记忆才能有效运作,这也是向量数据库之所以必要的原因,它为存储、管理和检索上下文数据提供了必要的基础设施。很多领先的 AI Agent 都在使用诸如 Milvus 和 Zilliz Cloud 这样的向量数据库,来构建快速、高效且可扩展的记忆系统。
向量数据库能够将信息存储为高维向量,来捕捉文本、图像或音频等非结构化数据的语义含义。这种结构使 AI Agent 能够快速执行相似性搜索并完成上下文检索。
比如,当一个 Agent 遇到一个新的问题时,可以先对向量数据库进行查询,找到过去类似的交互或相关知识,继而辅助决策。如果没有这样的记忆,Agent 将缺乏进行高级推理和自适应学习所需的连续性。
结论
本文中介绍的这些 AI Agent 仅仅是 2025 年代表性产品中的一小部分,其他有前景的 Agent,如 Anthropic Claude Agents、Hugging Face Transformers Agents 以及 Llamaindex 的 Llama Agents,同样值得关注。
如果这些 Agent 都不能满足您的需求,我们可以利用向量数据库、大语言模型轻松构建自己的 AI Agent。
更多 Agent 构建教程,参考以下文章:
教程:使用 Neo4j 和 Milvus 构建 GraphRAGAgent (https://zilliz.com/blog/build-graphrag-agent-with-neo4j-and-milvus)
教程:使用 Claude 3.5 Sonnet、LlamaIndex 和 Milvus 构建 AgentRAG (https://zilliz.com/blog/agentic-rag-using-claude-3.5-sonnet-llamaindex-and-milvus)
教程:使用 Milvus 和 LlamaIndex 构建用于 RAG 的 AIAgent (https://zilliz.com/blog/build-ai-agent-for-rag-with-milvus-and-llamaindex)
教程:使用 Milvus 和 Llama 3.2 构建语音助手 (https://zilliz.com/blog/build-your-voice-assistant-agentic-rag-with-milvus-and-llama-3-2)



