暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
DeepSeek创始人梁文锋专访 20250201.pdf
33
6页
5次
2025-02-13
免费下载
1
DeepSeek
创始人梁文锋专访
Deepseek
龚超
整理
记者
: DeepSeek V2 模型发布后,迅速引发了一场大模型价格战。有人说你们是行业的一条
鲶鱼,你们是有意成为鲶鱼的吗?
梁文峰
: 我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。
记者
: 这个结果让你们意外吗?
梁文峰
: 非常意外。我们没想到价格让大家这么敏感。我们只是按照自己的步调来做事,
后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上,稍微有
点利润。
记者
: 5 天后智谱 AI 就跟进了,之后是字节、阿里、百度、腾讯等大厂。智谱 AI 降的是
一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的,旗舰模型
降到和我们一样的价格,然后触发了其他大厂纷纷降价。因为大厂的模型成本比我们高很多,
所以我们没想到会有人亏钱做这件事。最后就变成了互联网时代的烧钱补贴的逻辑。
记者
: 外部看来,降价很像在抢用户,互联网时代的价格战通常如此。抢用户并不是我们的
主要目的,我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一
方面也觉得无论 API 还是 AI,都应该是普惠的,人人可以用得起的东西。
记者
: 在这之前,大部分中国公司都会直接 copy 这一代的 Llama 结构去做应用。为什么你
们会从模型结构切入?
梁文峰
: 如果目标是做应用,那沿用 Llama 结构,短平快上产品也是合理选择。但我们目的
地是 AGI,这 ,在 。这
scale up 大模型所需要做的基础研究之一。了模型结构,我们还做了大其他的研究,
包括怎么构造数据,如让模型像人等,这都现在我们发布的模型里。
记者
: Llama 的结构在训练效率理成本上,和国外先进估计差距。这
主要来自里?
梁文峰
: 训练效率差距我们估计平和国外最比,模型结构和
练动力学上可有一差距这一点,我们要消耗两倍的算力才能达到同样果。另外
数据效率上可也有一倍差距也就是我们要消耗两倍训练数据和算力才能达到同样的
果。合起来就要多消耗 4 。我们要做的正是不的去小这些差距
记者
: 大部分中国公司都选择要模型要应用,为什么 Deepseek 目前选择只做研究探索?
2
梁文峰
: 因为我们觉得现在最要的是参与全球创新的浪潮里去。去很多中国公司
习惯了别人做技术创新,我们拿过来做应用变现。但这并非是一理所然。这一波浪潮里,
我们的发点就不是趁机赚一技术的前沿,去推动整个生态
记者
: 互联网和移动互联网时代,留给大部分人的惯性认知识是,擅长搞技术创新,
更擅长做应用。我们经济,中国也要步成为贡献者,不是一直搭便车
30 IT 浪潮里,我们本没有参与到真正的技术创新里。我们已经习惯摩尔
从天降,在家里 18 ,就会更好件和件。Scaling Law 也在如此对待
但其实这是西方主技术社区一代代孜孜倦创造出来的。只因为之前我们没有参与这个
过程,以至于忽视在。
记者
: 为什么 DeepSeek V2 会让硅谷的很多人惊讶
梁文峰
: 天发的大量创新里,这是非常普通的一个。他们之所以惊讶是因为这
是一个中国公司,在以贡献者的身份加入到他们游戏里去。毕竟大部分中国公司习惯
follow 。但 ,也 。大
不是所有公司都有资本只去研究新,不是先考虑商
记者
: 新的成本定不去那种拿来主惯性也和去的国。但现在你看,
无论中国的经济体量还是字节、腾讯这大厂的利润全球都不我们定不
是资本,缺乏信心,以知道怎组织度的人,实现有新。
记者
: 为什么中国公司,包括钱的大厂,这么容易把快速化当第一要
梁文峰
: 30 我们都只调赚钱,对创新是忽视的。新不完全驱动的,还需
好奇心和创造欲。我们只是被过去那种惯性束缚了,但也是阶段性的。
记者
: 但你们究是一个组织非一个公益科构。选择新,过开源分享出
去,那要在护城河?像 5 MLA 构的新也会很快其他家 copy
梁文峰
: 颠覆性技术面前,成的护城河是短的。即使 Open AI 源,也无法阻
止被别人超。所以我们值沉淀团队上,我们的同事在这个过程中得到成积累
know-how,就
去什么,对于技术来说, follow 是很有成就感的事。其实像一个文行为,
业行为。给予其实是一种额外的荣誉,一个公司这么做也会有文
记者
: 么看类似朱啸虎的这种市信仰派观点?
梁文峰
: 朱啸虎是自的,但他的打法更适合快速赚钱的公司。你看国最赚钱的公司,
都是厚积薄发的高科技公司。但做大模型,单纯技术领先也很难形绝对优势
记者
: 你们的那个大的东西是什么?
梁文峰
: 我们看到的是,中国 AI 不可能永远处在跟位置我们常说,中国 AI
有一两年差距,但真实的 gap 是原和模仿。如果这个不变,中国永远
者。所以有探索也是的。英伟先不只是一个公司的是整个西方技术
3
社区和产业的结果。他们看到下一代的技术里有路线图。中国 AI 的发
同样需要这样的生态很多国产芯片不起来,也是因为缺乏配套技术社区只有第
二手。所以中国然需要有人技术的前沿。
记者
: 现在的 DeepSeek 有一 OpenAI 早期的理想主气质也是源的。你们会选
源吗?
梁文峰
: 我们不会源。我们为先有一个大的技术生态更重要。
记者
: 你们有吗?看有 DeepSeek 独立拆分上硅谷
AI 业公司,最也都要和大厂定。
梁文峰
: 没有。我们面问题从来不是钱,是高端芯片禁运
记者
: 很多人为做 AGI 和做量化完全不同的件事。量化可以闷声去做,但 AGI
需要高,需要结。这样可以让你的入变大。
梁文峰
: 多的入并不一定产生更多的新,则大厂可以所有的了。
记者
: 你们现在不做应用,是因为你们没有运营因吗?
梁文峰
: 我们阶段技术创新的不是应用的长远来说,我们
成一种生态就是业直接使用我们的技术和产我们只负责基础模型和前沿的新。
然后其他公司在 Deepseek 基础上构 toBtoC 的业如果能形整的产业上下
我们就没要自己做应用。然如果需要,我们做应用也没障碍但研究和技术创永远
我们第一先级。
记者
: 但选择 API ,为什么选择 DeepSeek 不是大厂?
梁文峰
: 世界很可基础大模型需要持续新,大厂有他的能力边界
并不一定合。
记者
: 技术真的可以开差距吗?你也说,并不绝对技术
梁文峰
: 技术没有,但需要时和成本。英伟显卡理论上没有何技术
容易复制组织团队下一代技术都需要时所以实护城河还是很
记者
: 你们降价后字节先跟进,说他们还是感威胁。你么看?
梁文峰
: 说实我们不 care 这件事,只是便件事。提供云服务不是我们的主要目
标,我们的目标还是去实现 AGI。目 ,但 。大
有现成的用户,但他的现金流也是他的,也会让他成为被颠覆
记者
: 么看 deepseek 之外的 6 家大模型业公司的终局
of 6
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。