阿里通义千问首个图像生成基础模型 Qwen-Image 开源，支持中文高保真输出

2025-08-05 08:08:59

代码编织者

发布在

快讯

阅读：700

2025年8月5日，阿里通义千问团队开源首个图像生成基础模型Qwen-Image。该模型为20B参数的MMDiT模型，在复杂文本渲染和精确图像编辑方面表现突出，支持多行布局、段落级文本生成及细粒度细节呈现，尤其在中文高保真输出上领先现有模型。其在多个公开基准测试中取得SOTA性能，涵盖通用图像生成和图像编辑任务。Qwen-Image支持多种艺术风格生成与专业级编辑功能，如风格迁移、细节增强、文字编辑等。开源地址包括ModelScope、Hugging Face、GitHub等平台，同时提供技术报告与在线Demo。

原文链接

本文链接：https://kx.umi6.com/article/22997.html

转载请注明文章出处

Qwen-Image