标题:Kimi超越DeepSeek的新模型被指“套壳”Qwen?真相如何?
昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B,在SWE-bench Verified测试中取得60.4%的成绩,刷新记录。然而,该模型基于Qwen/Qwen2.5-72B开发的消息引发争议。
Kimi-Dev-72B并非全新训练,而是以Qwen 2.5-72B为基础,结合数百万GitHub问题单和PR提交进行二次开发。其创新点在于采用大规模强化学习技术,在Docker环境中修复代码仓库问题,确保生成代码的正确性和实用性。
在SWE-bench上,Kimi-Dev-72B表现突出,大幅超越其他开源模型。许可证方面,Kimi-Dev-72B采用MIT协议,但需遵循Qwen-2.5-72B的原始许可限制。
争议焦点在于Qwen团队是否授予月之暗面使用权限。Qwen2.5系列部分模型采用Apache 2.0协议,但72B模型受商业限制。对此,Qwen团队承认这是“历史遗留问题”,并承诺Qwen3系列已全面转向Apache 2.0协议。
这一案例表明,基于开源模型的“二次创新”正成为趋势。尽管Kimi-Dev表现优异,但实际应用中仍有改进空间。开源策略正从限制性许可转向更开放的模式,推动行业协作与生态繁荣。
原文链接
本文链接:https://kx.umi6.com/article/20395.html
转载请注明文章出处
相关推荐
换一换
前谷歌CEO:千万不要低估中国的AI竞争力
2025-05-10 12:07:51
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
2025-06-27 15:12:57
可能是目前效果最好的开源生图模型,混元生图3.0来了
2025-09-30 21:34:24
小米网页 AI 聊天服务惊喜亮相,MiMo-V2-Flash 模型发布、代码能力开源最强
2025-12-17 00:07:31
腾讯混元 3D 开源 + 2:瞄准游戏建模、3D 打印
2025-09-26 19:32:11
MiniMax发布全球首个混合架构开源模型M1 称强化训练成本仅53万美金
2025-06-17 19:29:56
英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍
2025-12-15 23:04:58
可玩转千余款游戏,英伟达联合斯坦福等研发 NitroGen 开源模型
2025-12-21 11:38:39
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
Altman对话YC总裁:OpenAI的开源模型将远超期待
2025-06-23 10:30:02
667 文章
435707 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29