DeepSeek 10 PDF
2025.2.3
1 DeepSeek . . . . . . . . . . . . . . . . . . . . . . 2
1.1 DeepSeek . . . . . . . . . . . . . . . . . 2
1.2 DeepSeek . . . . . . . . . . . . . . . . . . . 2
1.3 DeepSeek . . . . . . . . . . . . . . . . . . . 4
2 DeepSeek . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1 LLM . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Transformer . . . . . . . . . . . . . . . . . . . . . . 6
2.3 LLM . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3.1 Pretraining . . . . . . . . . . . . . . . . . . 7
2.3.2 Supervised Fine-Tuning, SFT . . . . . . 7
2.3.3 Reinforcement Learning, RL . . . . . . . 7
3 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . 7
3.1 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . 7
3.1.1 1 R1-Zero . . . . . . . 8
3.1.2 2 . . . . . . . . . . . . . . . 8
3.2 R1-Zero . . . . . . . . . . . . . . 9
3.3 . . . . . . . . . . . . . . . . . . . . . . 10
3.4 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . . 11
4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1
相关文档
评论