100行代码打造迷你编程Agent：修复65%真项目bug，适配所有大模型

2025-07-27 21:02:45

智慧棱镜

发布在

科普

阅读：976

100行代码打造迷你编程Agent：修复65%真项目bug，适配所有大模型

只需100行代码，就能构建一个轻量级但功能强大的编程助手——mini-SWE-agent。这是SWE-bench和SWE-agent团队推出的新开源项目，不依赖额外插件，兼容几乎所有主流语言模型，并能在本地终端轻松部署。其核心代码虽短，却能解决SWE-bench测试集中65%的真实项目Bug，性能与原版相当。

相比原版SWE-agent，mini-SWE-agent大幅简化了架构。它仅需约100行Python代码（含环境和脚本总计约200行），无需复杂依赖或工具调用接口，直接通过Bash环境执行命令，兼容任何语言模型。此外，它采用线性历史记录、独立单步执行和直观的命令行工具，取消复杂的YAML配置，支持多种容器（如Docker、Podman等），便于跨平台部署。

尽管设计极简，mini-SWE-agent在性能上毫不妥协，仍能解决65%的SWE-bench问题，并附带批量推理、轨迹浏览器等实用工具，提供可视化界面帮助用户交互式观察执行过程。适合快速本地运行、微调实验及简化控制流需求的开发者使用。而需要高度可配置工具链或复杂状态管理的场景，则更适合原版SWE-agent。

该项目由普林斯顿大学团队于2024年发起，成员包括John Yang、Carlos E. Jimenez及OpenAI研究员姚顺雨等。SWE-bench已成为评估大语言模型编程能力的经典基准，而SWE-agent则定义了智能体与计算机交互的标准接口方式。这些创新源于一次20分钟的头脑风暴，目标是将GitHub上的真实开发流程转化为结构化任务，用于评估和提升语言模型的编程能力。

项目主页：
[1] https://github.com/SWE-agent/mini-swe-agent
[2] https://github.com/SWE-agent/mini-swe-agent?tab=readme-ov-file

原文链接

本文链接：https://kx.umi6.com/article/22520.html

转载请注明文章出处

mini-SWE-agent