2025年10月29日,苹果公司发布Pico-Banana-400K数据集,包含40万张图像,用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建,采用非商业性研究许可,供学术研究使用。苹果团队从OpenImages中选取多样化真实照片,并设计35种编辑指令,涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后,由Gemini 2.5-Pro进行质量评估,确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对,助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv,数据集在GitHub免费开放。
原文链接
本文链接:https://kx.umi6.com/article/27450.html
转载请注明文章出处
相关推荐
换一换
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
2025-02-13 18:12:26
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
2025-06-06 16:37:39
稚晖君后宇树也来玩开源了:机器人操作数据集,采用抱抱脸LeRobot训练测试,网友:泰裤辣!
2024-11-13 15:40:13
图像界的DeepSeek!12B参数对标GPT-4o,消费级硬件玩转编辑生成
2025-07-01 10:52:29
全球最大甲骨文“数据集”开源
2024-07-06 03:51:10
香港大学李弘扬:「2025年具身智能新一代闭环智能系统」迫在眉睫丨具身先锋十人谈
2025-02-21 17:59:53
人形机器人量产落地关键!“天才少年”开源百万真机数据集 动作捕捉或迎广阔增量空间
2024-12-31 08:39:31
蚂蚁数科向全球开源180万深度伪造定位数据集,助力AI算法可解释
2025-08-18 16:48:37
谷歌推出 Gemini 本地图像编辑功能:动动手就能让 AI 帮你改图
2025-05-01 17:30:47
Stable Diffusion 3开源秒翻车,画人好掉san
2024-06-13 19:30:09
傅利叶开源全尺寸人形机器人数据集,首批上线超3万条真机数据
2025-03-17 12:36:41
华为云CEO周跃峰:加速医疗AI落地,共建共享行业模型、高质量数据集等
2026-02-02 13:38:37
650 文章
452669 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18