12月22日,阿里宣布开源全新图像生成模型Qwen-Image-Layered,首次实现类似Photoshop的图层理解与编辑功能。该模型可将图片分解为多个RGBA图层,确保编辑操作仅作用于目标图层,从而实现‘零漂移’精准编辑,解决AI生成图像一致性难题。通过该模型,用户可完成重新着色、替换对象、修改文字、删除物体、缩放及移动物体等操作,且支持3层或8层分解选择。这一创新加速了大模型在专业设计领域的应用落地。相关技术报告和代码已发布在GitHub、ModelScope及Hugging Face平台,Demo也同步上线供体验。
原文链接
本文链接:https://kx.umi6.com/article/30626.html
转载请注明文章出处
相关推荐
换一换
谷歌发布新一代图像生成模型 Nano Banana Pro:基于 Gemini 3 Pro 打造,支持 4K 分辨率与完美文字渲染
2025-11-20 23:48:33
GPT-4o图像生成今起免费!奥特曼坐镇紧急发布,指令遵循/文本控制表现惊艳
2025-03-26 10:43:57
Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放
2024-07-03 16:53:44
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL!
2024-11-13 14:38:52
免费用:OpenAI 最强 AI 生图模型登场,奥尔特曼变身性感消防员
2025-12-17 08:27:39
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
OpenAI 将 ChatGPT 新图像生成技术引入 API,每张图约 2 美分起
2025-04-24 08:29:07
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
2025-03-31 12:26:06
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
阿里通义千问首个图像生成基础模型 Qwen-Image 开源,支持中文高保真输出
2025-08-05 08:08:59
腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图
2025-05-16 17:56:45
截胡 OpenAI,谷歌全模态模型首次解禁!Gemini 2.0 中文唠嗑式 P 图引动漫游戏圈关注
2025-03-13 15:23:45
615 文章
364837 浏览
24小时热文
更多
-
2025-12-22 17:57:05 -
2025-12-22 17:56:10 -
2025-12-22 17:55:58