Kimi新模型Kimi-Dev开源,参数量仅72B却拿下代码开源SOTA。该模型由月之暗面发布,在SWE-bench Verified上的成绩达到60.4%,超越最新DeepSeek-R1及部分闭源模型。
Kimi-Dev基于MIT协议开源,包含权重和代码,甚至有量化版本上线。其核心技术在于结合BugFixer和TestWriter两种角色,通过文件定位与代码编辑实现问题修复和测试编写。研发团队从Qwen 2.5-72B出发,利用1500亿高质量数据进行训练,涵盖数百万GitHub issue和PR提交,并严格净化数据避免过拟合。
强化学习阶段采用结果导向奖励、高效提示集及正向示例强化等策略,显著提升了代码编辑能力。测试中,Kimi-Dev-72B可生成40个补丁候选和测试候选,并展现规模效应。未来,团队计划扩展至更复杂任务并与主流开发工具深度集成。
项目主页:https://moonshotai.github.io/Kimi-Dev/
GitHub:https://github.com/MoonshotAI/Kimi-Dev
HuggingFace:https://huggingface.co/moonshotai/Kimi-Dev-72B
原文链接
本文链接:https://kx.umi6.com/article/20307.html
转载请注明文章出处
相关推荐
换一换
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
2025-06-17 13:22:19
超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
2024-11-13 16:40:09
AI Coding能撑起一个多大的叙事?
2024-11-18 18:30:51
Claude Sonnet4.5来了,Anthropic说自己工程师已不写代码了,这次我信了
2025-09-30 11:26:54
小米超级小爱近期更新功能一览公布,含随心修图、AI 文生图、圈屏搜题等
2026-01-21 16:17:25
苏州“十五五”规划建议:推进人工智能驱动的新型科研范式、技术研发、工程实现、产品落地一体化协同发展 积极部署人工智能芯片、量子等创新应用技术
2026-01-21 20:27:59
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
与他们谈论AI后,感觉大家都是温水里的青蛙
2026-01-21 20:23:27
645 文章
432789 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29