2025年9月18日,DeepSeek团队在《Nature》封面发表论文,首次回应关于模型蒸馏OpenAI的质疑。DeepSeek-V3-Base训练数据来自普通网页和电子书,未故意加入合成数据,且数据截止时间为2024年7月,当时尚无先进推理模型发布,降低了无意蒸馏的可能性。团队承认部分网页含OpenAI生成内容,可能间接影响模型知识。研究采用纯强化学习框架,通过组相对策略优化算法,依据答案正确性给予奖励,促使模型涌现高级行为。Hugging Face工程师Lewis Tunstall认为,DeepSeek方案无需依赖OpenAI蒸馏即可实现高性能。
原文链接
本文链接:https://kx.umi6.com/article/25450.html
转载请注明文章出处
相关推荐
换一换
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
OpenAI家务机器人售价2万美元
2026-01-06 03:42:50
OpenAI 计划于今年下半年推出首款硬件设备
2026-01-20 00:22:40
有望挑战传统机翻,OpenAI 低调上线“ChatGPT 翻译”页面
2026-01-15 08:20:52
迪士尼与OpenAI达成战略合作与内容授权协议
2025-12-13 13:53:11
OpenAI 与晶圆级 AI 芯片企业 Cerebras 达成合作,三年部署 750MW 推理系统
2026-01-15 10:26:49
美国甲骨文公司:不会延迟交付为OpenAI建造的数据中心
2025-12-13 20:07:27
OpenAI 首款硬件设备被曝为 AI 耳机,首年有望出货 4000~5000 万台
2026-01-21 12:05:04
智能车轮碾过,在2025留下十道车辙
2025-12-30 15:26:18
DeepSeek更新GitHub仓库 新模型“MODEL1”曝光
2026-01-21 11:03:39
OpenAI据称计划以8300亿美元的估值筹资至多1000亿美元 以支持其雄心勃勃的增长计划
2025-12-19 07:34:47
OpenAI 向软银集团旗下数字基础设施公司 SB Energy 投资 5 亿美元
2026-01-10 12:10:02
OpenAI、Anthropic 讨论与生物技术及其他公司的数据交易
2025-12-17 23:08:38
681 文章
452143 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44