又一开源AI神器!将机器学习论文自动转为可运行代码库
近日,一款名为PaperCoder的开源工具引发关注。这款多智能体大语言模型系统能够自动将机器学习论文中的内容转化为可运行的代码库。据统计,2024年顶会如NeurIPS、ICML和ICLR上仅有21%的论文提供了代码,导致复现成果速度缓慢。为此,韩国科学技术院的研究团队开发了PaperCoder,通过规划、分析和代码生成三个阶段,分别由不同智能体完成任务,最终生成的代码得到了77%原作者的认可。
PaperCoder的工作流程分为三个主要阶段:规划、分析和代码生成。在规划阶段,系统会生成总体计划、架构设计、逻辑设计和配置文件;分析阶段则细化为文件级规范;代码生成阶段负责实现具体功能。每个阶段都有详细的提示词指导模型完成任务。
研究团队使用了多个模型进行实验,包括DS-Coder、Qwen-Coder、DS-Distil-Qwen和o3-mini-high。评估涉及90篇顶会论文,并构建了Paper2Code基准测试。结果显示,PaperCoder在代码准确性、规范性和可执行性方面表现优异,尤其在人类评估中,77%的论文原作者倾向于选择它生成的代码。此外,o3-mini-high因其高相关性被广泛采用。
更多详情可查阅原论文及源代码。
原文链接
本文链接:https://kx.umi6.com/article/18066.html
转载请注明文章出处
相关推荐
换一换
aiXcoder:AI并非软件开发的“银弹”,需与软件工程结合
2025-12-24 17:52:13
未来的科技历史,将如何发展?
2025-03-07 10:03:26
Ubuntu 团队测试 AI 生成代码:总体表现尚可,但一小部分函数“完全错误”
2025-12-07 20:45:46
谷歌:目前谷歌所有新代码中 75%由人工智能生成
2026-04-22 20:28:17
又一开源AI神器来了
2025-05-01 12:23:22
最强编程“大脑”:OpenAI 开放 GPT-5.2-Codex API,实战连续一周狂写 300+ 万行代码
2026-01-16 08:22:05
谷歌:公司超过 1/4 的新代码是由人工智能生成的
2024-10-30 11:06:40
GitHub Copilot 推出视觉功能:图片可秒变代码
2025-02-08 10:20:04
自主操作电脑的多模态 Agent 升级,智谱 GLM-PC 开放体验
2025-01-23 15:23:22
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
2025-08-01 15:00:45
微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升
2025-08-13 08:31:33
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
2025-05-11 13:19:07
1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力
2024-07-25 08:13:10
736 文章
636512 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41