综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年12月,ViT核心作者、Meta超级智能团队成员Lucas Beyer盛赞中国开源模型Qwen-Image-Layered,称其图像生成能力远超Nano Banana和ChatGPT。该模型基于扩散技术,可将图片分解为多个含透明度信息的RGBA图层,实现精细化编辑,如局部修改、背景替换、主体更换等。相比传统方法,Qwen-Image-Layered避免了递归错误,擅长处理复杂遮挡、半透明及文字场景。模型支持可变层数拆解,满足多样化需求,并已在GitHub开源。网友评价其效果类似开源版Photoshop,令人惊叹。
原文链接
12月22日,阿里宣布开源全新图像生成模型Qwen-Image-Layered,首次实现类似Photoshop的图层理解与编辑功能。该模型可将图片分解为多个RGBA图层,确保编辑操作仅作用于目标图层,从而实现‘零漂移’精准编辑,解决AI生成图像一致性难题。通过该模型,用户可完成重新着色、替换对象、修改文字、删除物体、缩放及移动物体等操作,且支持3层或8层分解选择。这一创新加速了大模型在专业设计领域的应用落地。相关技术报告和代码已发布在GitHub、ModelScope及Hugging Face平台,Demo也同步上线供体验。
原文链接
12月22日,阿里开源全新图像生成模型Qwen-Image-Layered,首次实现PS级图层理解与精准编辑。该模型采用自研创新架构,可将图片拆解为多个图层,解决AI生图一致性难题,适用于专业设计领域。通过引入透明度图层的“Alpha通道”和VLD-MMDiT架构,模型能自动补全遮挡背景,提升空间理解能力。训练数据来自海量Photoshop文件,赋予AI专业分层思维。业内人士认为,这一技术将变革创意产业,大幅提升数字内容创作效率。目前,Qwen-Image-Layered已在魔搭社区和HuggingFace开源,支持免费商用。阿里已开源近400个千问模型,全球下载量超7亿次,服务超100万家企业客户。
原文链接
加载更多
暂无内容