1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年10月29日,苹果公司发布Pico-Banana-400K数据集,包含40万张图像,用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建,采用非商业性研究许可,供学术研究使用。苹果团队从OpenImages中选取多样化真实照片,并设计35种编辑指令,涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后,由Gemini 2.5-Pro进行质量评估,确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对,助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv,数据集在GitHub免费开放。

原文链接
本文链接:https://kx.umi6.com/article/27450.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
谷歌nano banana火爆出圈 AI应用有望站上市场风口
2025-09-01 08:15:00
iPad可用AI绘画交互编辑神器火了,网友:颤抖吧PS
2024-12-01 19:36:50
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
2024-11-11 20:43:03
全球首个:智元机器人宣布开源 AgiBot World 百万真机数据集,大幅超越谷歌 Open X-Embodiment
2024-12-30 13:17:17
人形机器人:最初的设想,最后的归宿
2025-04-22 08:09:04
全球最大甲骨文“数据集”开源
2024-07-06 03:51:10
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
修图 AI 模型 Qwen-Image-Edit-2511 开源上线:提升角色一致性、增强几何推理
2025-12-25 15:42:29
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
国家数据局指导:DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布,用于 AI 机器人训练
2025-09-01 23:24:23
Stable Diffusion 3开源秒翻车,画人好掉san
2024-06-13 19:30:09
AI画不出的左手,是因为我们给了它一个偏科的童年
2025-12-11 14:56:05
24小时热文
更多
扫一扫体验小程序