腾讯旗下混元图像2.0(Hunyuan Image 2.0)发布,实现毫秒级响应的“边说边画”实时文生图功能。用户可通过文字描述或语音输入生成图像,支持参考图特征提取及画面优化。此外,新增实时绘画板模式,结合手绘草图与文本描述生成图像。技术亮点包括更大模型参数、自研高压缩比图像编解码器、适配多模态大语言模型作为文本编码器,以及强化学习后训练提升生成真实感。该模型在语义匹配能力测试中表现优异,官网已开放测试资格。腾讯混元团队还预告即将推出原生多模态图像生成大模型。
原文链接
本文链接:https://kx.umi6.com/article/18691.html
转载请注明文章出处
相关推荐
.png)
换一换
Runway全面开放新文生图模型Frames
2025-01-22 08:53:58
百度发布iRAG,李彦宏:AI行业最大变化是大模型基本消除幻觉
2024-11-12 19:12:06
ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展
2025-03-26 04:32:17
416 文章
68933 浏览
24小时热文
更多

-
2025-07-19 14:57:21
-
2025-07-19 14:56:08
-
2025-07-19 14:55:01