标题:Kimi超越DeepSeek的新模型被指“套壳”Qwen?真相如何?
昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B,在SWE-bench Verified测试中取得60.4%的成绩,刷新记录。然而,该模型基于Qwen/Qwen2.5-72B开发的消息引发争议。
Kimi-Dev-72B并非全新训练,而是以Qwen 2.5-72B为基础,结合数百万GitHub问题单和PR提交进行二次开发。其创新点在于采用大规模强化学习技术,在Docker环境中修复代码仓库问题,确保生成代码的正确性和实用性。
在SWE-bench上,Kimi-Dev-72B表现突出,大幅超越其他开源模型。许可证方面,Kimi-Dev-72B采用MIT协议,但需遵循Qwen-2.5-72B的原始许可限制。
争议焦点在于Qwen团队是否授予月之暗面使用权限。Qwen2.5系列部分模型采用Apache 2.0协议,但72B模型受商业限制。对此,Qwen团队承认这是“历史遗留问题”,并承诺Qwen3系列已全面转向Apache 2.0协议。
这一案例表明,基于开源模型的“二次创新”正成为趋势。尽管Kimi-Dev表现优异,但实际应用中仍有改进空间。开源策略正从限制性许可转向更开放的模式,推动行业协作与生态繁荣。
原文链接
本文链接:https://kx.umi6.com/article/20395.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek V3 引发AI路径之辩:从“鹦鹉学舌”到“乌鸦喝水”?
2025-01-02 11:15:16
匆匆发布的Llama4
2025-04-06 16:09:03
阿里通义回应与Manus合作:确实在开源模型方面进行合作
2025-03-11 19:51:17
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
“开源模型验货官”Perplexity,给Kimi K2盖了个戳
2025-07-21 11:17:17
阿里通义千问:确实在与 Manus 进行开源模型方面的合作
2025-03-11 20:47:27
奥特曼再谈DeepSeek
2025-02-08 17:27:08
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
Meta首席科学家杨立昆谈DeepSeek:开源模型正在超越专有模型
2025-01-27 08:27:22
消息称智谱 GLM-4.5 今晚开源新模型,知情人士回应确有其事
2025-07-28 16:20:04
谷歌前 CEO 施密特称中国领先的大模型皆为开源,呼吁中美开展合作
2025-07-26 16:43:43
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
514 文章
181931 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17