
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年8月5日,阿里通义千问团队开源首个图像生成基础模型Qwen-Image。该模型为20B参数的MMDiT模型,在复杂文本渲染和精确图像编辑方面表现突出,支持多行布局、段落级文本生成及细粒度细节呈现,尤其在中文高保真输出上领先现有模型。其在多个公开基准测试中取得SOTA性能,涵盖通用图像生成和图像编辑任务。Qwen-Image支持多种艺术风格生成与专业级编辑功能,如风格迁移、细节增强、文字编辑等。开源地址包括ModelScope、Hugging Face、GitHub等平台,同时提供技术报告与在线Demo。
原文链接
8月5日,阿里通义千问Qwen开源了全新文生图模型Qwen-Image,这是一个20B参数的MMDiT模型,也是通义千问系列中首个图像生成基础模型。Qwen-Image在复杂文本渲染和精确图像编辑方面表现优异,通过增强的多任务训练范式,能够保持编辑一致性。在多个公开基准测试中,该模型在各类生成与编辑任务中均达到SOTA(当前最优)水平,展现出强大的性能。这一开源发布为图像生成领域提供了重要工具,并有望推动相关技术进一步发展。
原文链接
加载更多

暂无内容