1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月18日,苹果研究团队发布全新多模态AI模型UniGen 1.5,成功在单一系统中集成图像理解、生成与编辑三大功能。该模型通过“编辑指令对齐”技术提升图像修改精准度,并设计统一奖励系统优化训练过程。测试显示,UniGen 1.5在GenEval和DPG-Bench基准中分别获得0.89和86.83高分,在ImgEdit专项测试中表现优于多个开源及闭源模型。然而,模型仍存在局限性,如生成图片文字易出错及主体特征漂移问题,团队计划进一步优化。这一成果为视觉AI领域带来重要突破。

原文链接
本文链接:https://kx.umi6.com/article/30459.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌nano banana火爆出圈 AI应用有望站上市场风口
2025-09-01 08:15:00
阿里通义千问:推出图像编辑模型Qwen-Image-Edit
2025-08-19 09:59:40
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
阶跃星辰开源图像编辑模型Step1X-Edit
2025-04-27 11:14:13
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
谷歌认领最强AI版Photoshop!现在人人可用,效果确实强悍
2025-08-27 16:05:56
阿里云通义万相推出图像编辑模型 ACE:一句话即可让 AI 修改图片
2024-11-30 23:20:09
修图 AI 模型 Qwen-Image-Edit-2511 开源上线:提升角色一致性、增强几何推理
2025-12-25 15:42:29
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
2024-11-11 20:43:03
这个春节P图不求人!小红书开源图像编辑新SOTA
2026-02-12 20:41:16
图像界的DeepSeek!12B参数对标GPT-4o,消费级硬件玩转编辑生成
2025-07-01 10:52:29
谷歌 Gemini 2.5 Flash 升级 AI 修图功能,多项表现优于 GPT-4o
2025-08-27 09:00:44
24小时热文
更多
扫一扫体验小程序