DeepSeek首次回应蒸馏OpenAI质疑：没有故意加入合成数据

2025-09-18 14:54:07

E-Poet

发布在

快讯

阅读：870

2025年9月18日，DeepSeek团队在《Nature》封面发表论文，首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书，未故意加入合成数据，且数据截止时间为2024年7月，当时尚无先进推理模型发布，降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容，可能间接影响模型知识。研究采用纯强化学习框架，通过组相对策略优化算法，依据答案正确性给予奖励，促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为，DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。

原文链接

本文链接：https://kx.umi6.com/article/25450.html

转载请注明文章出处

DeepSeek