标题:Kimi超越DeepSeek的新模型被指“套壳”Qwen?真相如何?
昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B,在SWE-bench Verified测试中取得60.4%的成绩,刷新记录。然而,该模型基于Qwen/Qwen2.5-72B开发的消息引发争议。
Kimi-Dev-72B并非全新训练,而是以Qwen 2.5-72B为基础,结合数百万GitHub问题单和PR提交进行二次开发。其创新点在于采用大规模强化学习技术,在Docker环境中修复代码仓库问题,确保生成代码的正确性和实用性。
在SWE-bench上,Kimi-Dev-72B表现突出,大幅超越其他开源模型。许可证方面,Kimi-Dev-72B采用MIT协议,但需遵循Qwen-2.5-72B的原始许可限制。
争议焦点在于Qwen团队是否授予月之暗面使用权限。Qwen2.5系列部分模型采用Apache 2.0协议,但72B模型受商业限制。对此,Qwen团队承认这是“历史遗留问题”,并承诺Qwen3系列已全面转向Apache 2.0协议。
这一案例表明,基于开源模型的“二次创新”正成为趋势。尽管Kimi-Dev表现优异,但实际应用中仍有改进空间。开源策略正从限制性许可转向更开放的模式,推动行业协作与生态繁荣。
原文链接
本文链接:https://kx.umi6.com/article/20395.html
转载请注明文章出处
相关推荐
换一换
张亚勤谈大模型的未来:全球不超10个 且中美将各占三四个
2026-03-18 11:06:09
手机也能跑大模型,腾讯混元推出多款小尺寸开源模型
2025-08-04 17:00:39
对话朱啸虎:搬离中国,假装不是中国AI创业公司,是没有用的
2025-09-20 20:35:10
刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini
2025-08-06 06:22:19
谷歌DeepMind高管公开邀请千问团队入职
2026-03-05 15:31:45
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
2025-11-08 15:49:04
DeepSeek V4终于发布!打破最强闭源垄断,明确携手华为芯片
2026-04-24 13:09:49
商汤开源 SenseNova-MARS,突破多模态搜索推理天花板
2026-01-30 18:41:28
出圈一周年,DeepSeek的变与不变
2026-01-16 15:50:22
OpenAI进入新品发布周期 开源模型GPT-OSS打头阵
2025-08-06 08:26:35
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
中国在开源 AI 模型市场首超美国,与 OpenAI 之“封闭”形成鲜明对比
2025-11-26 12:43:57
微软将 OpenAI 最小开源模型 gpt-oss-20b 引入 Windows,本地也能跑
2025-08-07 11:47:50
770 文章
686285 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41