暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
2023 中国开源开发者报告_opt.pdf
94
87页
11次
2024-02-27
免费下载
1
1
/*使用电脑阅读,获得最佳体
1
1
毫无疑问,开源开发者圈子来看,
2023 年是大模型 LLM
年、生成式 AI GenAI
一、
这自然要从 OpenAI 说起,前一年年底ChatGPT 的横
空出世,标志着
对话式 LLM
开始进入公众视野,为人们
2023 3
GPT-4.0 LLM
的台,为 LLM 广泛应用奠定了基。再后的 11
OpenAI GPTs
ChatGPT OpenAI
LLM 一哥的宏大叙事能力与强劲技术实力。
二、
New Bing(Bing AI)代表了微软在 LLM 领域的野心和
LLM
应用场景——
“智能对话+联网搜索”
——无缝整合了起来,
大有干掉搜索行业和问答社区趋势,后事实明,全
IT Stack OverFlow
Google Bard
LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不
如人意,车翻了又翻。
三、
Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM
在语言理解和多模态处理能力方面的探索,甚至 Claude 2
还一度被誉为实力可以硬 ChatGPT。 Meta 开源的
Llama 2 更成为了
LLM 领域开源势力的典型代表
它的
出现,犹如一颗投入平静湖面石子,荡起层水波,
“Llama 2 一开源,全球范围内进入了
百模混战
阶段”,
这个说法一点也不为过。
年底的“虚假宣传” Gemini 与“磁力链开源” Mistral
8x7B 两大神作,也凭借不输 GPT-4 的实力, LLM
潮卷到天际
四、
Stable Diffusion Midjourney
的出现,极大地拓展和加速 LLM 在计算机视觉领域的应
用,它们突破了传统图像生成方式的局限,仅需要用户提供
文字描述,就可以生成高质量的数字艺术作品。它们的图像
生成质量、样式多样性和用户便捷性都是极大的突破。这为
广大的个人用户和创意行业提供了强有力的工具,彻底改变
了数字艺术内容的创作方式。同时,它们也引发了人工智能
在创作领域的伦理和法律讨论。LLM 杀进多媒体领。往
DALL-E 3 模型升级、Adobe 产品整合 LLM 能力、
语音 whisper-3 、AI 虚拟造等都是
这条路上的进一步发展。
五、
AI 编程方面,Copilot 可以根据开发者的代码提示自动补
全代码,大大提高了开发效率。这也引发了代码原创性的讨
论,但它已经实实在在将 LLM 拉进了编程应用领域。
六、
LangChain 的出现,实现 LLM 之间的链式交互使多
LLM
LLM 模型与外部数据源进行连接,产生更强大的语言理解
和生成效果。这开启了 LLM 集成应用的新方向并诞生了
一个新的细分领域“LLMOps”
七、
“提示词工程”,这 LLM 直接催生出来的新“学科”,
它的核心在于研究人类如何与 LLM 更好地进行“沟通”,
找到让 LLM 能够准确理解人类意图的方法。提示词工程探
索如何以 LLM 可以解析的方式来表达需要它完成的任务,
寻找 LLM “最佳输入形式”通过注入提示词,提示词
工程建立了一套“人机交互语法”来更精准地 LLM
达想要它生成何种输出的指令。这为人们与 LLM 之间建立
高效、准确的“沟通桥梁”提供了可能性。什么“链式思考
1
1
(CoT)”、“自动推理并使用工具(ART)”、“思维
树(ToT)”……甚至运用心理学对 LLM 行“情绪提
(EmotionPrompt提示词工程俨然在将 LLM
点一点解剖试图让人类成为可以将其掌控的“咒术师”
八、
AutoGPT 的出现,带着 LLM Agent 的概念进入 LLM
发展的新阶段。LLM Agent 是一种基 LLM 的智能代
理,它能够自主学习和执行任,具有定的“认知能力
和决策能力”。LLM Agent 的出现,标志着 LLM
统的模型训练应用式,转向 Agent 心的智能
LLM Agent LLM 使
LLM 能够主动学习和执行任务,从而提高了 LLM 的应用
范围和价值;它为 LLM 的智能化发展提供了新的方向,
使 LLM 能够更加接近于人类智能
九、
AI 原生目前还没有明确的定义,大致是说,不同于当前
各种应用在原本的基础上增加 AI 能力,使其智能化,但
它的智能只充当了“辅助”角;在 AI 原生的语境下
LLM 从一开始就是应用的中枢,应用本身的架构、功能、
交互层是围 LLM 中枢来构建的。也许 ChatGPT 是最
经典的“AI 原生”应用。此概念目前还处在萌芽期,明确
的概念、应用场景、架构、技栈细节尚未完自洽。
换一种视角来看,这个概念的出其实没技术么事,
有人称之为“造商业概念”,这里按下不表。
十、
镜头给到国内。相比国际上当前 AI GenAI,国内更
多地还是在 LLM 这一层面,Robin Li “卷大模型没意
义,卷应用机会更大”,其实很深刻地指出了内中区别
本报告以开发者视角为主,从 LLM 入,但实际上或多
或少与 GenAI 脱不开关系。
2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬
刚”ChatGPT,到后来各式各样的大模型与产品出现,
盖了不同的领域和场景,构建了多元化的大模型生态
大模型方面,百花齐放:百度的文心一言、抖音的云雀大模
型、智谱 AI GLM 大模型、中科院的紫东太初大模型、
百川智能的百川大模型、商汤的日日新大模型、MiniMax
ABAB 大模型、上海人工智能实验室的书生通用大模型
讯的混元大模型、蚂蚁的百灵大模型等
另一方面,除了大模型本身,中国在 LLM 相关技术领域也
快速迭代发展,诸如 Dify.AI LLMOps、Milvus 的向量
CodeGeeX Comate AI LLM
Prompt 的研究、OneFlow 的深度学习框架。
值得一提的还有华为的盘古大模型,其中盘古气象大模型是
首个精度超过传统数值预报方法的 AI 模型,速度相比传统
10000
报。盘古大模型的研究成果在国际顶级学术期刊《自然》正
刊发表,获得国际学术界的认可。
年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处
理约 40 万字的文本,成为当时全球大模型中最长的上下文
窗口。其中 Yi-34B Hugging Face 英文测试榜单中位
列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。
十一、
2023 LLM
GenAI。根据金融数据和软件公司 PitchBook 的数据,从
截至 3 29 日追踪的 9 易来,生 AI 公司
的投前值中位数已经升至 9000 万美元,高于 2022
年的 4250 美元。PitchBook 的分析师预测,以 32%
的复年增率计,到 2026 生成 AI 市场规
将达到 981 亿美元。
of 87
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。