1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Kimi超越DeepSeek的新模型被指“套壳”Qwen?真相如何?

昨天深夜,月之暗面发布了开源代码模型Kimi-Dev-72B,在SWE-bench Verified测试中取得60.4%的成绩,刷新记录。然而,该模型基于Qwen/Qwen2.5-72B开发的消息引发争议。

Kimi-Dev-72B并非全新训练,而是以Qwen 2.5-72B为基础,结合数百万GitHub问题单和PR提交进行二次开发。其创新点在于采用大规模强化学习技术,在Docker环境中修复代码仓库问题,确保生成代码的正确性和实用性。

在SWE-bench上,Kimi-Dev-72B表现突出,大幅超越其他开源模型。许可证方面,Kimi-Dev-72B采用MIT协议,但需遵循Qwen-2.5-72B的原始许可限制。

争议焦点在于Qwen团队是否授予月之暗面使用权限。Qwen2.5系列部分模型采用Apache 2.0协议,但72B模型受商业限制。对此,Qwen团队承认这是“历史遗留问题”,并承诺Qwen3系列已全面转向Apache 2.0协议。

这一案例表明,基于开源模型的“二次创新”正成为趋势。尽管Kimi-Dev表现优异,但实际应用中仍有改进空间。开源策略正从限制性许可转向更开放的模式,推动行业协作与生态繁荣。

原文链接
本文链接:https://kx.umi6.com/article/20395.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱发布新一代开源模型 极速版最高达到200tokens/秒
2025-04-15 08:25:16
DeepSeek终于丢了开源第一王座,但继任者依然来自中国
2025-07-18 17:42:26
“开源王者”Llama4,却让DeepSeek们松了一口气
2025-04-07 08:47:00
24小时热文
更多
扫一扫体验小程序