1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

又一开源AI神器!将机器学习论文自动转为可运行代码库

近日,一款名为PaperCoder的开源工具引发关注。这款多智能体大语言模型系统能够自动将机器学习论文中的内容转化为可运行的代码库。据统计,2024年顶会如NeurIPS、ICML和ICLR上仅有21%的论文提供了代码,导致复现成果速度缓慢。为此,韩国科学技术院的研究团队开发了PaperCoder,通过规划、分析和代码生成三个阶段,分别由不同智能体完成任务,最终生成的代码得到了77%原作者的认可。

PaperCoder的工作流程分为三个主要阶段:规划、分析和代码生成。在规划阶段,系统会生成总体计划、架构设计、逻辑设计和配置文件;分析阶段则细化为文件级规范;代码生成阶段负责实现具体功能。每个阶段都有详细的提示词指导模型完成任务。

研究团队使用了多个模型进行实验,包括DS-Coder、Qwen-Coder、DS-Distil-Qwen和o3-mini-high。评估涉及90篇顶会论文,并构建了Paper2Code基准测试。结果显示,PaperCoder在代码准确性、规范性和可执行性方面表现优异,尤其在人类评估中,77%的论文原作者倾向于选择它生成的代码。此外,o3-mini-high因其高相关性被广泛采用。

更多详情可查阅原论文及源代码。

原文链接
本文链接:https://kx.umi6.com/article/18066.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最强编程“大脑”:OpenAI 开放 GPT-5.2-Codex API,实战连续一周狂写 300+ 万行代码
2026-01-16 08:22:05
苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码
2025-07-05 09:57:16
大模型自指:代码生成的递归式自我提升
2025-09-02 20:37:56
为什么只有AI编程成功落地?
2025-01-14 11:12:57
Ubuntu 团队测试 AI 生成代码:总体表现尚可,但一小部分函数“完全错误”
2025-12-07 20:45:46
将偏好学习引入模型训练,北大李戈团队新框架,可显著提升代码准确性与执行效率
2024-11-28 00:08:18
今年TRAE写的代码:100000000000行!超50%程序员每天在按Tab键
2025-12-29 14:23:35
又一开源AI神器!将机器学习论文自动转为可运行代码库
2025-05-01 12:21:11
字节Seed首次开源代码模型,拿下同规模多个SOTA,提出用小模型管理数据范式
2025-05-11 13:19:07
168 小时 AI 狂写 300 万行代码造出浏览器!Cursor 公开数百个智能体自主协作方案
2026-01-18 12:16:45
aiXcoder:AI并非软件开发的“银弹”,需与软件工程结合
2025-12-24 17:52:13
自主操作电脑的多模态 Agent 升级,智谱 GLM-PC 开放体验
2025-01-23 15:23:22
谷歌:公司超过 1/4 的新代码是由人工智能生成的
2024-10-30 11:06:40
24小时热文
更多
扫一扫体验小程序