2025年9月18日,DeepSeek团队在《Nature》封面发表论文,首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书,未故意加入合成数据,且数据截止时间为2024年7月,当时尚无先进推理模型发布,降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容,可能间接影响模型知识。研究采用纯强化学习框架,通过组相对策略优化算法,依据答案正确性给予奖励,促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为,DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。
原文链接
本文链接:https://kx.umi6.com/article/25450.html
转载请注明文章出处
相关推荐
换一换
OpenAI三位高管同日离职
2026-04-21 00:33:46
菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题
2026-05-21 17:54:30
报告:Anthropic企业采用率首超OpenAI
2026-05-14 13:40:50
OpenAI推出药物研发AI模型 挑战谷歌
2026-04-17 05:42:36
涨价浪潮下 DeepSeek推动AI“价格战”:百万Token输入0.25元
2026-04-26 10:07:20
欧盟委员会对OpenAI开放新型ChatGPT模型访问权限表示欢迎
2026-05-11 20:28:29
DeepSeek专家模式无法上传文件 官方提示:目前资源紧张
2026-05-14 16:48:15
DeepSeek注册资本提高50%
2026-04-28 09:06:54
OpenAI推出网络安全模型Daybreak
2026-05-12 11:13:49
腾讯与阿里巴巴洽谈投资DeepSeek 估值超过200亿美元
2026-04-22 19:27:03
OpenAI首席执行官:AI普及并不会引发“就业末日”
2026-05-26 16:40:26
马斯克称OpenAI是自己的创意 现任CEO奥尔特曼是“小偷”
2026-04-29 14:26:51
Deepseek官网公布deepseek-v4接口文档
2026-04-24 11:10:00
774 文章
691604 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41