1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

100行代码打造迷你编程Agent:修复65%真项目bug,适配所有大模型

只需100行代码,就能构建一个轻量级但功能强大的编程助手——mini-SWE-agent。这是SWE-bench和SWE-agent团队推出的新开源项目,不依赖额外插件,兼容几乎所有主流语言模型,并能在本地终端轻松部署。其核心代码虽短,却能解决SWE-bench测试集中65%的真实项目Bug,性能与原版相当。

相比原版SWE-agent,mini-SWE-agent大幅简化了架构。它仅需约100行Python代码(含环境和脚本总计约200行),无需复杂依赖或工具调用接口,直接通过Bash环境执行命令,兼容任何语言模型。此外,它采用线性历史记录、独立单步执行和直观的命令行工具,取消复杂的YAML配置,支持多种容器(如Docker、Podman等),便于跨平台部署。

尽管设计极简,mini-SWE-agent在性能上毫不妥协,仍能解决65%的SWE-bench问题,并附带批量推理、轨迹浏览器等实用工具,提供可视化界面帮助用户交互式观察执行过程。适合快速本地运行、微调实验及简化控制流需求的开发者使用。而需要高度可配置工具链或复杂状态管理的场景,则更适合原版SWE-agent。

该项目由普林斯顿大学团队于2024年发起,成员包括John Yang、Carlos E. Jimenez及OpenAI研究员姚顺雨等。SWE-bench已成为评估大语言模型编程能力的经典基准,而SWE-agent则定义了智能体与计算机交互的标准接口方式。这些创新源于一次20分钟的头脑风暴,目标是将GitHub上的真实开发流程转化为结构化任务,用于评估和提升语言模型的编程能力。

项目主页:
[1] https://github.com/SWE-agent/mini-swe-agent
[2] https://github.com/SWE-agent/mini-swe-agent?tab=readme-ov-file

原文链接
本文链接:https://kx.umi6.com/article/22520.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Anthropic突然封锁中国企业,我们该从中学到什么?
2025-09-06 11:33:57
100行代码打造迷你编程Agent:修复65%真项目bug,适配所有大模型
2025-07-27 21:02:45
大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
2025-06-27 15:08:34
全球最大云厂商亚马逊 AWS,将“最牛马”的工作交给了 AI Agent
2025-12-07 18:39:34
设立河南首支AI基金,领投众擎赋能产业生态
2025-12-08 15:33:26
陕西“十五五”规划建议:组建陕西人工智能产业联盟 打造西部人工智能发展高地
2025-12-08 09:18:51
国家医保数字人“医小保”介绍商保目录:19款药品入选 9个为1类新药
2025-12-07 13:30:59
重庆“十五五”规划建议:支持领军企业牵头组建“人工智能+汽车”生态联盟 布局超快充、换电站、加氢站等设施网络
2025-12-08 08:16:57
快手可灵 O1 主体库上线:只要有多角度参考图就能让 AI“记住”主角
2025-12-06 21:53:19
西北首台量子计算机落地西安
2025-12-07 08:18:21
微博 CEO 王高飞回应能否让 AI 手机自己发微博:需要确认
2025-12-08 09:17:44
美的“美罗 U”首曝,行业首创六臂轮足式人形机器人
2025-12-07 15:33:32
荣耀工程师谈豆包手机:AI 时代新的交互模式探索,未来一定会涌现更多“体验闭环
2025-12-08 10:18:34
24小时热文
更多
扫一扫体验小程序