2025年10月29日,苹果公司发布Pico-Banana-400K数据集,包含40万张图像,用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建,采用非商业性研究许可,供学术研究使用。苹果团队从OpenImages中选取多样化真实照片,并设计35种编辑指令,涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后,由Gemini 2.5-Pro进行质量评估,确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对,助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv,数据集在GitHub免费开放。
原文链接
本文链接:https://kx.umi6.com/article/27450.html
转载请注明文章出处
相关推荐
换一换
首个沉浸式体积视频数据集ImViD上线,定义沉浸式媒体新形态丨CVPR‘25 Highlight
2025-06-12 13:32:25
傅利叶开源全尺寸人形机器人数据集,首批上线超3万条真机数据
2025-03-17 12:36:41
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025-08-23 18:04:04
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
2024-12-01 19:36:50
大规模多构型具身智能新数据集和基准:5.5万条机器人轨迹数据,279项不同任务
2024-12-27 14:01:36
全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
2025-08-19 07:53:42
Stable Diffusion 3开源秒翻车,画人好掉san
2024-06-13 19:30:09
蚂蚁数科向全球开源180万深度伪造定位数据集,助力AI算法可解释
2025-08-18 16:48:37
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频
2025-02-17 09:42:01
全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
2025-02-17 13:48:24
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
2024-11-11 20:43:03
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
2024-11-30 23:20:09
国家数据局指导:DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布,用于 AI 机器人训练
2025-09-01 23:24:23
527 文章
248481 浏览
24小时热文
更多
-
2025-10-29 19:06:11 -
2025-10-29 19:05:00 -
2025-10-29 19:03:49