苹果发布 Pico-Banana-400K 数据集：含 40 万张图像，帮助训练 AI 图像编辑模型

2025-10-29 09:42:14

电子诗篇

发布在

快讯

阅读：1307

2025年10月29日，苹果公司发布Pico-Banana-400K数据集，包含40万张图像，用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建，采用非商业性研究许可，供学术研究使用。苹果团队从OpenImages中选取多样化真实照片，并设计35种编辑指令，涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后，由Gemini 2.5-Pro进行质量评估，确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对，助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv，数据集在GitHub免费开放。

原文链接

本文链接：https://kx.umi6.com/article/27450.html

转载请注明文章出处

Pico-Banana-400K