(CoT)”、“自动推理并使用工具(ART)”、“思维
树(ToT)”……甚至运用心理学对 LLM 进行“情绪提
示(EmotionPrompt)”,提示词工程俨然在将 LLM 一
点一点解剖,试图让人类成为可以将其掌控的“咒术师”。
八、
AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM
发展的新阶段。LLM Agent 是一种基于 LLM 的智能代
理,它能够自主学习和执行任务,具有一定的“认知能力
和决策能力”。LLM Agent 的出现,标志着 LLM 从传
统的模型训练和应用模式,转向以 Agent 为中心的智能
化模式。LLM Agent 打破了传统 LLM 的被动性,使
LLM 能够主动学习和执行任务,从而提高了 LLM 的应用
范围和价值;它为 LLM 的智能化发展提供了新的方向,
使 LLM 能够更加接近于人类智能。
九、
AI 原生,目前还没有明确的定义,大致是说,不同于当前
各种应用在原本的基础上增加 AI 能力,使其智能化,但
它的智能只充当了“辅助”角色;在 AI 原生的语境下,
LLM 从一开始就是应用的中枢,应用本身的架构、功能、
交互层是围绕 LLM 中枢来构建的。也许 ChatGPT 是最
经典的“AI 原生”应用。此概念目前还处在萌芽期,明确
的概念、应用场景、架构、技术栈细节等尚未完成自洽。
换一种视角来看,这个概念的提出其实都没技术什么事,
有人称之为“造商业概念”,这里按下不表。
十、
镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更
多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意
义,卷应用机会更大”,其实很深刻地指出了内中区别。
本报告以开发者视角为主,从 LLM 切入,但实际上或多
或少与 GenAI 脱不开关系。
2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬
刚”ChatGPT,到后来各式各样的大模型与产品出现,覆
盖了不同的领域和场景,构建了多元化的大模型生态。
大模型方面,百花齐放:百度的文心一言、抖音的云雀大模
型、智谱 AI 的 GLM 大模型、中科院的紫东太初大模型、
百川智能的百川大模型、商汤的日日新大模型、MiniMax 的
ABAB 大模型、上海人工智能实验室的书生通用大模型、腾
讯的混元大模型、蚂蚁的百灵大模型等。
另一方面,除了大模型本身,中国在 LLM 相关技术领域也
快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量
数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM
Prompt 的研究、OneFlow 的深度学习框架。
值得一提的还有华为的盘古大模型,其中盘古气象大模型是
首个精度超过传统数值预报方法的 AI 模型,速度相比传统
数值预报提速 10000 倍以上,能够提供全球气象秒级预
报。盘古大模型的研究成果在国际顶级学术期刊《自然》正
刊发表,获得国际学术界的认可。
年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处
理约 40 万字的文本,成为当时全球大模型中最长的上下文
窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位
列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。
十一、
这一小节,通过一些数据来简要概述 2023 年的 LLM、
GenAI。根据金融数据和软件公司 PitchBook 的数据,从
截至 3 月 29 日追踪的 9 笔交易来看,生成式 AI 公司
的投前估值中位数已经飙升至 9000 万美元,高于 2022
年的 4250 万美元。PitchBook 的分析师预测,以 32%
的复合年增长率计算,到 2026 年,生成式 AI 市场规模
将达到 981 亿美元。
相关文档
评论