2025年9月18日,DeepSeek团队在《Nature》封面发表论文,首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书,未故意加入合成数据,且数据截止时间为2024年7月,当时尚无先进推理模型发布,降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容,可能间接影响模型知识。研究采用纯强化学习框架,通过组相对策略优化算法,依据答案正确性给予奖励,促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为,DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。
原文链接
本文链接:https://kx.umi6.com/article/25450.html
转载请注明文章出处
相关推荐
换一换
OpenAI新模型GPT-5.1发布
2025-11-13 09:50:48
前红杉资本掌舵人:SpaceX比OpenAI更值钱
2025-11-19 19:34:18
剑指全球最大订阅服务!OpenAI预计:ChatGPT五年内付费用户将达2.2亿
2025-11-26 14:47:40
最新测试版 App 代码显示,ChatGPT 未来或引入广告
2025-11-29 23:44:48
OpenAI:今夏曾考虑过投资火箭公司
2025-12-04 16:34:33
消息称 OpenAI 内部拉响“红色警报”:奥尔特曼亲自下令改进 ChatGPT,计划下周一发布新推理模型
2025-12-02 19:29:38
NuerIPS唯一满分论文曝光,来自清华上交
2025-11-11 17:16:47
业界风向标变了?OpenAI被票选为“最有可能失败初创公司”第二名!
2025-11-18 11:15:52
OpenAI和NextDC计划斥资46亿美元在澳大利亚悉尼建设数据中心
2025-12-05 11:28:34
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
AI泡沫担忧愈演愈烈,这“烂摊子”就连英伟达也救不了?一文读懂
2025-11-24 17:09:10
消息称 Anthropic 有望比 OpenAI 更快实现盈利,前者 2028 年就能盈亏平衡
2025-11-11 19:21:58
OpenAI首席研究员Mark Chen长访谈:小扎亲手端汤来公司挖人,气得我们端着汤去了Meta
2025-12-03 09:05:55
623 文章
366914 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52