1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年10月29日,苹果公司发布Pico-Banana-400K数据集,包含40万张图像,用于训练文本引导的AI图像编辑模型。该数据集基于谷歌Gemini-2.5模型构建,采用非商业性研究许可,供学术研究使用。苹果团队从OpenImages中选取多样化真实照片,并设计35种编辑指令,涵盖像素调整、场景编辑等八大类别。通过Nanon-Banana模型生成编辑结果后,由Gemini 2.5-Pro进行质量评估,确保数据准确性。数据集包括单轮与多轮编辑样本及偏好对比对,助力解决现有数据集领域偏移等问题。相关论文已发布于arXiv,数据集在GitHub免费开放。

原文链接
本文链接:https://kx.umi6.com/article/27450.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
全自动组装家具,斯坦福发布 IKEA Video Manuals 数据集
2024-12-03 11:14:31
字节跳动发布图像编辑模型SeedEdit 3.0
2025-06-06 16:38:41
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
2025-08-19 09:59:40
华为云CEO周跃峰:加速医疗AI落地,共建共享行业模型、高质量数据集等
2026-02-02 13:38:37
一句话 P 图,字节跳动发布通用图像编辑模型 SeedEdit
2024-11-12 19:13:10
阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
2025-12-25 17:49:41
香港大学李弘扬:「2025年具身智能新一代闭环智能系统」迫在眉睫丨具身先锋十人谈
2025-02-21 17:59:53
全球空间智能第一股!浙大清华“三剑客”,英伟达基因,填补两大技术空白
2025-02-17 13:48:24
谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
2025-02-13 18:12:26
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
首个沉浸式体积视频数据集ImViD上线,定义沉浸式媒体新形态丨CVPR‘25 Highlight
2025-06-12 13:32:25
国家数据局指导:DexonomySim 具身智能灵巧手多样抓取仿真数据集正式开源发布,用于 AI 机器人训练
2025-09-01 23:24:23
24小时热文
更多
扫一扫体验小程序