2025年8月5日,阿里通义千问团队开源首个图像生成基础模型Qwen-Image。该模型为20B参数的MMDiT模型,在复杂文本渲染和精确图像编辑方面表现突出,支持多行布局、段落级文本生成及细粒度细节呈现,尤其在中文高保真输出上领先现有模型。其在多个公开基准测试中取得SOTA性能,涵盖通用图像生成和图像编辑任务。Qwen-Image支持多种艺术风格生成与专业级编辑功能,如风格迁移、细节增强、文字编辑等。开源地址包括ModelScope、Hugging Face、GitHub等平台,同时提供技术报告与在线Demo。
原文链接
本文链接:https://kx.umi6.com/article/22997.html
转载请注明文章出处
相关推荐
.png)
换一换
OpenAI发布生图神器狙击Google,一句话精细P图
2025-03-26 08:41:03
OpenAI的吉卜力,撞车了被字节起诉“投毒AI”的前实习生?
2025-04-03 14:24:18
ChatGPT闯入一条危险赛道:新图像生成功能极擅长伪造收据
2025-04-02 15:32:04
Recraft 完成 3000 万美元 B 轮融资,其图像生成模型曾击败 DALL-E 和 Midjourney
2025-05-06 17:58:54
8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源
2025-03-19 12:25:56
截胡 OpenAI,谷歌全模态模型首次解禁!Gemini 2.0 中文唠嗑式 P 图引动漫游戏圈关注
2025-03-13 15:23:45
NeurIPS 2024最佳论文揭晓!北大字节获最佳论文,清华厦大为亚军
2024-12-04 15:37:50
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
2024-06-27 13:56:56
通义千问开源全新文生图模型Qwen-Image
2025-08-05 07:09:44
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器
2025-04-09 17:59:20
国产SOTA新模型精准get“画(3+6)条命的动物” | 开源
2025-06-20 17:00:54
OpenAI 推迟免费版 ChatGPT 图像生成功能上线时间
2025-03-27 07:32:32
436 文章
80997 浏览
24小时热文
更多

-
2025-08-05 10:12:31
-
2025-08-05 10:12:22
-
2025-08-05 10:11:22