8月26日,谷歌DeepMind发布Gemini 2.5 Flash图像编辑模型,支持基于文字指令的高精度修图,在多项任务中表现优于GPT-4o。新模型亮点包括“角色一致性”功能,可确保人物、动物或物体在多张图片中外观一致,适合批量制作品牌素材与产品目录。此外,它支持局部编辑、风格迁移以及简单因果推理(如生成气球撞向仙人掌的画面)。该功能已在Gemini应用上线,用户需切换至“Flash”模式使用,生成图像带水印。开发者可通过Gemini API等试用,费用为每百万token 30美元,单张图片约0.039美元。
原文链接
本文链接:https://kx.umi6.com/article/24247.html
转载请注明文章出处
相关推荐
换一换
比NanoBanana更擅长中文和细节控制!兔展&北大Uniworld V2刷新SOTA
2025-11-05 15:09:36
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
2025-04-27 12:13:44
谷歌Gemini2.0新神技,难评
2025-03-17 22:00:35
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro
2025-04-18 16:14:46
可媲美GPT-4o的开源图像生成框架来了!腾讯联手InstantX解决角色一致性难题
2025-04-25 17:17:07
一句话 P 图,字节跳动发布通用图像编辑模型 SeedEdit
2024-11-12 19:13:10
GPT-4o-Image仅完成28.9%任务!上海AI实验室等发布图像编辑新基准,360道人类专家严选难题
2025-05-30 15:52:41
全能图像编辑 AI 模型 Qwen-Image-Edit 发布:哪里不对改哪里,文字也能随心换
2025-08-19 07:53:42
清华系Sora全球上线!注册即用不排队,重点支持动漫风
2024-07-30 13:47:14
谷歌大模型“性价比之王”来了
2025-04-18 12:12:29
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
2024-11-11 20:43:03
神秘“香蕉”AI 火爆海外,10轮极限测试后,我相信P 图这个词已经过时了
2025-08-23 18:04:04
699 文章
522891 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18