Kimi新模型Kimi-Dev开源,参数量仅72B却拿下代码开源SOTA。该模型由月之暗面发布,在SWE-bench Verified上的成绩达到60.4%,超越最新DeepSeek-R1及部分闭源模型。
Kimi-Dev基于MIT协议开源,包含权重和代码,甚至有量化版本上线。其核心技术在于结合BugFixer和TestWriter两种角色,通过文件定位与代码编辑实现问题修复和测试编写。研发团队从Qwen 2.5-72B出发,利用1500亿高质量数据进行训练,涵盖数百万GitHub issue和PR提交,并严格净化数据避免过拟合。
强化学习阶段采用结果导向奖励、高效提示集及正向示例强化等策略,显著提升了代码编辑能力。测试中,Kimi-Dev-72B可生成40个补丁候选和测试候选,并展现规模效应。未来,团队计划扩展至更复杂任务并与主流开发工具深度集成。
项目主页:https://moonshotai.github.io/Kimi-Dev/
GitHub:https://github.com/MoonshotAI/Kimi-Dev
HuggingFace:https://huggingface.co/moonshotai/Kimi-Dev-72B
原文链接
本文链接:https://kx.umi6.com/article/20307.html
转载请注明文章出处
相关推荐
换一换
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
AI Coding能撑起一个多大的叙事?
2024-11-18 18:30:51
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
2025-06-17 13:22:19
超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
2024-11-13 16:40:09
Claude Sonnet4.5来了,Anthropic说自己工程师已不写代码了,这次我信了
2025-09-30 11:26:54
2025 日本国际机器人展闭幕,中国企业占据人形机器人半壁江山
2025-12-07 22:51:22
广东“十五五”规划建议:深入推进数字广东建设 加强人工智能治理
2025-12-08 08:14:45
科创引领新经济 数智驱动新发展——2025东方财富私募风云际会论坛盛大召开
2025-12-08 15:32:36
马斯克谈每年发射100万吨AI卫星:大规模运行AI最低成本方式
2025-12-08 10:20:50
陕西“十五五”规划建议:组建陕西人工智能产业联盟 打造西部人工智能发展高地
2025-12-08 09:18:51
苹果陷AI困局 iPhone用户出现倒戈潮
2025-12-07 16:37:13
联想天禧AI足球智能体正式上线,亮相咪咕世界杯抽签夜直播
2025-12-06 17:40:08
602 文章
362167 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30