2025年9月18日,DeepSeek团队在《Nature》封面发表论文,首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书,未故意加入合成数据,且数据截止时间为2024年7月,当时尚无先进推理模型发布,降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容,可能间接影响模型知识。研究采用纯强化学习框架,通过组相对策略优化算法,依据答案正确性给予奖励,促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为,DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。
原文链接
本文链接:https://kx.umi6.com/article/25450.html
转载请注明文章出处
相关推荐
换一换
加拿大校园枪击案枪手作案数月前曾与人工智能发生涉枪支暴力对话
2026-02-22 05:13:55
英伟达据悉接近达成协议在OpenAI最新一轮融资中投资200亿美元
2026-02-04 08:28:18
OpenAI战略大转舵 全速冲刺ChatGPT商业化
2026-02-03 13:39:40
2亿美元薪资都留不住 硅谷“最贵华人”被OpenAI挖走
2026-02-27 14:47:59
不读博士,照样进OpenAI!o1核心成员现身说法了
2026-01-25 20:26:08
OpenAI:GPT-5.2/Codex模型的速度现已提升40%
2026-02-04 13:45:40
OpenAI拟在ChatGPT中测试定向广告加码营收增长计划
2026-01-17 04:09:18
GPT-5.3上线Codex!OpenAI回应Claude新模型只用了15分钟
2026-02-06 11:46:30
亚马逊据悉正在商谈向OpenAI投资高达500亿美元并扩大合作关系
2026-01-30 09:18:25
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
DeepSeek新论文剧透V4新框架!用闲置网卡加速智能体推理性能
2026-02-27 16:53:38
OpenAI推出Prism 可用于撰写论文和协作研究
2026-01-28 10:18:55
马斯克与OpenAI的恩怨情仇
2026-01-23 22:18:50
710 文章
505170 浏览
24小时热文
更多
-
2026-03-10 12:13:43 -
2026-03-10 11:10:02 -
2026-03-10 11:09:29