1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Kimi新模型Kimi-Dev开源,参数量仅72B却拿下代码开源SOTA。该模型由月之暗面发布,在SWE-bench Verified上的成绩达到60.4%,超越最新DeepSeek-R1及部分闭源模型。

Kimi-Dev基于MIT协议开源,包含权重和代码,甚至有量化版本上线。其核心技术在于结合BugFixer和TestWriter两种角色,通过文件定位与代码编辑实现问题修复和测试编写。研发团队从Qwen 2.5-72B出发,利用1500亿高质量数据进行训练,涵盖数百万GitHub issue和PR提交,并严格净化数据避免过拟合。

强化学习阶段采用结果导向奖励、高效提示集及正向示例强化等策略,显著提升了代码编辑能力。测试中,Kimi-Dev-72B可生成40个补丁候选和测试候选,并展现规模效应。未来,团队计划扩展至更复杂任务并与主流开发工具深度集成。

项目主页:https://moonshotai.github.io/Kimi-Dev/
GitHub:https://github.com/MoonshotAI/Kimi-Dev
HuggingFace:https://huggingface.co/moonshotai/Kimi-Dev-72B

原文链接
本文链接:https://kx.umi6.com/article/20307.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
超越GPT-4o!阿里云开源最强代码模型Qwen2.5-Coder
2024-11-13 16:40:09
Kimi超过DeepSeek的新模型被指“套壳”Qwen?到底怎么回事儿
2025-06-18 21:42:36
AI Coding能撑起一个多大的叙事?
2024-11-18 18:30:51
Claude Sonnet4.5来了,Anthropic说自己工程师已不写代码了,这次我信了
2025-09-30 11:26:54
打破代码大模型训练瓶颈:MicroCoder将算法数据框架训练经验升级
2026-03-30 01:19:37
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
有人靠CPU把AI算力密度卷到了新高度
2026-06-05 22:17:47
程序员爆料:Token烧到扛不住 公司全栈AI项目半路夭折
2026-06-03 17:32:02
AI眼镜卖爆!5月成交额暴涨超200% 大量老外来华强北扫货
2026-06-06 00:24:23
难上热搜的高考数学,我拿ChatGPT和豆包PK了一把!
2026-06-08 17:37:12
英博数科亮相CCIG 2026,首次公开EBFlex私有化算力管理平台
2026-06-04 16:10:54
世界模型榜首易主!跨维智能登顶WorldArena
2026-06-03 19:33:11
CVPR 2026 几何智能研究盘点:从看见形状,到理解运动与交互
2026-06-08 11:25:46
24小时热文
更多
扫一扫体验小程序