正文:9月9日,腾讯宣布混元图像模型2.1正式开源,支持原生2K图像生成及中英文输入。新版本引入PromptEnhancer文本改写模型,可自动补全和优化输入描述,实现精准语义表达,同时支持中英文双向转换。模型具备1k tokens的超长prompt处理能力,擅长复杂场景生成与多主体描述,显著减少文字错误与理解偏差。新增双通道文本编码器、两阶段模型架构等技术亮点,大幅提升生成效率与图像质感。此外,通过高压缩率VAE和meanflow推理加速,2K图像生成耗时与同类模型1K图相当,推理步数从100步降至8步。
原文链接
本文链接:https://kx.umi6.com/article/24949.html
转载请注明文章出处
相关推荐
.png)
换一换
腾讯混元图像模型 2.1 上新开源:原生 2K 生图、中英文输入
2025-09-10 00:24:21
Databricks融资10亿美元 估值超过1000亿美元
2025-09-08 22:04:30
博主的边界没了
2025-09-09 08:09:10
ASML 官宣同 Mistral AI 达成战略合作伙伴关系,并向后者投资 13 亿欧元
2025-09-09 14:16:53
AI教父被前女友用AI甩了
2025-09-09 10:10:39
字节跳动发布Seedream 4.0图像创作模型
2025-09-09 13:15:57
国内首家支持全形态 AI 编程工具:腾讯发布自研 AI CLI 工具 CodeBuddy Code
2025-09-09 16:18:15
百度发布文心大模型 X1.1 深度思考模型,整体表现超越 DeepSeek R1
2025-09-09 13:14:51
Mistral AI完成17亿欧元C轮融资 ASML领投
2025-09-09 13:17:04
贝叶斯X非线性:基于动态因果的复杂系统自动建模方法
2025-09-09 19:19:06
大模型破译甲骨文创下新 SOTA,复旦团队推出新框架
2025-09-08 14:00:34
脑电波相亲?国产脑机的“曲线救国”
2025-09-09 20:20:55
AirPods Pro3,让你不戴手表也能“运动”了
2025-09-10 04:26:05
537 文章
182013 浏览
24小时热文
更多

-
2025-09-10 04:26:05
-
2025-09-10 01:24:36
-
2025-09-10 00:24:21