暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
deepseek大模型生态报告(赛迪,200502).pdf
43
150页
5次
2025-03-10
5墨值下载
I
deepseek 大模型生态报告
赛迪研究院电子信息研究所
2025 2
I
一、DeepSeek 大模型背景 ....................... 1
(一)深度求索公司情况 ................... 1
(二)模型迭代历程 ....................... 2
(三)研发团队情况 ....................... 3
1. 北京大学罗福莉 ............................................ 4
2. 北京大学高华佐 ............................................ 4
3. 北京邮电大学曾旺丁 .................................... 5
4. 北京大学朱琪豪 ............................................ 5
5. 北京大学代达劢 ............................................ 6
6. 北京大学王炳宣 ............................................ 6
7. 浙江大学梁文锋 ............................................ 7
二、DeepSeek 大模型应用现状 ................... 8
(一)国内情况 ........................... 8
(二)全球情况 .......................... 10
三、DeepSeek 大模型技术特点 .................. 11
(一)技术创新 .......................... 11
1. 压缩:从结构到量化 .................................. 11
1)多层注意 MLA ........................... 12
2FP8 混合精度训练框架 ................ 13
2. 并行:对硬件的极限使用 .......................... 16
1DualPipe 节点通信 ..................... 16
2)无辅助损失的负载均衡策略 ......... 18
3)底层通信优 ................................. 20
3. 总结 .............................................................. 20
(二)训练成本 .......................... 21
四、DeepSeek 大模型产业生态 .................. 22
(一)企业 .............................. 22
II
1. DeepSeek 系列新模型正式上线腾社区,
为小艺已接入 DeepSeek .......................................... 22
2. 三大运营商全面接入 DeepSeek ................. 23
3. 多家公司宣布接入 DeepSeek ..................... 23
4. 微软、英伟达、亚马逊全部接入 DeepSeek
.................................................................................... 25
5. 燧原科技实现全国各地智算中心 DeepSeek
的全量推理服务部署 ............................................... 26
6. 多家券商也积极“拥抱”DeepSeek .......... 26
(二)生态 .............................. 27
1. Deepseek 应用 27 日登顶苹果中国地区和美
国地区应用商店免费 APP 下载排行榜 .................. 27
2. DeepSeek 在开源社区 GitHub 上的 Star 数首
次超越 OpenAI ......................................................... 28
3. 国家超算互联网正式上线 DeepSeek ......... 29
4. DeepSeek 正准备适配中国国产 GPU ... 29
5. DeepSeek 的风,火速吹遍了终端企业 ...... 30
(三)应用 .............................. 32
1. 文学 .............................................................. 32
2. 编程 .............................................................. 32
(四)基础设施 .......................... 35
五、DeepSeek 大模型产业影响 .................. 35
(一)对人工智能技术的影响 .............. 35
1. 吴恩达谈 DeepSeek中国 AI 迎头赶上,
大算力并不是 AI 进步的唯一途径 ......................... 35
2. 蒸馏技术将成为行业突破口 ...................... 36
(二)对产业生态的影响 .................. 37
1. DeepSeek 开源对于企业战略价值 .............. 37
2. DeepSeek 是否真的绕开了 CUDA ......... 39
3. DeepSeek
少吗?........................................................................ 39
of 150
5墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。