Kimi新模型Kimi-Dev开源,参数量仅72B却拿下代码开源SOTA。该模型由月之暗面发布,在SWE-bench Verified上的成绩达到60.4%,超越最新DeepSeek-R1及部分闭源模型。
Kimi-Dev基于MIT协议开源,包含权重和代码,甚至有量化版本上线。其核心技术在于结合BugFixer和TestWriter两种角色,通过文件定位与代码编辑实现问题修复和测试编写。研发团队从Qwen 2.5-72B出发,利用1500亿高质量数据进行训练,涵盖数百万GitHub issue和PR提交,并严格净化数据避免过拟合。
强化学习阶段采用结果导向奖励、高效提示集及正向示例强化等策略,显著提升了代码编辑能力。测试中,Kimi-Dev-72B可生成40个补丁候选和测试候选,并展现规模效应。未来,团队计划扩展至更复杂任务并与主流开发工具深度集成。
项目主页:https://moonshotai.github.io/Kimi-Dev/
GitHub:https://github.com/MoonshotAI/Kimi-Dev
HuggingFace:https://huggingface.co/moonshotai/Kimi-Dev-72B
原文链接
本文链接:https://kx.umi6.com/article/20307.html
转载请注明文章出处
相关推荐
.png)
换一换
AI Coding能撑起一个多大的叙事?
2024-11-18 18:30:51
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
2025-06-17 13:22:19
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
2024-11-13 16:40:09
Anthropic突然封锁中国企业,我们该从中学到什么?
2025-09-06 11:33:57
蚂蚁国际推出 AI 智能体支付解决方案,可识别用户支付意图、全流程追溯询证
2025-09-05 15:20:28
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
2025-09-04 18:07:12
2025世界智能产业博览会签约项目金额超2000亿元
2025-09-05 18:26:52
视频理解新标杆,快手多模态推理模型开源:128k上下文+0.1秒级视频定位+跨模态推理
2025-09-05 22:26:24
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
中信建投:计算机板块上半年业绩持续改善 看好AI软件&硬件、信创等板块投资机会
2025-09-05 09:17:05
趁着HBM热潮加速!SK海力士Q2蝉联全球DRAM市占率第一
2025-09-05 13:22:16
494 文章
184880 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24