谷歌北大联手推出学术版Banana,论文图表100%精确生成
Nano Banana的学术特供版——PaperBanana,由谷歌与北大联合打造,近期因其卓越表现刷屏。它不仅能优化人工绘制的插图,还能通过代码生成精准图表,成为学术界的“效率神器”。
PaperBanana的核心优势在于其多智能体协作机制,包含5个分工明确的智能体:
- 检索智能体:从顶会论文库中寻找相似参考案例。
- 规划智能体:将文字描述转化为详细绘图说明书。
- 风格智能体:制定配色、排版等美学标准。
- 可视化智能体:根据说明书生成初稿。
- 批判智能体:检查并优化图表,迭代3轮提升质量。
团队构建了PaperBananaBench评估系统,从NeurIPS 2025的论文中提取高质量样本进行测试。实验结果显示,PaperBanana在忠实性、简洁性、可读性和美观性上全面超越传统方法,总分提升17.0%,尤其在简洁性(+37.2%)和可读性(+12.9%)方面表现突出。盲测中,72.7%的研究员认为其生成的图表优于基线模型。
PaperBanana支持两种模式:
1. 代码生成模式:利用Gemini-3-Pro生成Python代码,确保数值100%精准。
2. 直接生图模式:跳过代码生成,视觉效果更佳但可能有数值误差。
尽管PaperBanana无法编辑生成的图表,且在细节上仍逊于手工绘制,但它能显著优化已有插图,使其更美观、专业,适合投稿顶会。
项目由北大与谷歌Cloud AI Research联合开发,团队包括北大博士生Dawei Zhu及其导师Sujian Li,以及谷歌的Tomas Pfister等专家。目前,PaperBanana已在GitHub收获上千星标,广受关注。
项目主页:https://dwzhu-pku.github.io/PaperBanana/
论文地址:https://arxiv.org/abs/2601.23265
GitHub:https://github.com/dwzhu-pku/PaperBanana
-
2026-02-05 16:02:47 -
2026-02-05 16:01:39 -
2026-02-05 16:00:33