鹅厂放大招，混元图像2.0「边说边画」：描述完，图也生成好了

2025-05-16 17:18:33

量子黑客

发布在

快讯

阅读：949

腾讯旗下混元图像2.0（Hunyuan Image 2.0）发布，实现毫秒级响应的“边说边画”实时文生图功能。用户可通过文字描述或语音输入生成图像，支持参考图特征提取及画面优化。此外，新增实时绘画板模式，结合手绘草图与文本描述生成图像。技术亮点包括更大模型参数、自研高压缩比图像编解码器、适配多模态大语言模型作为文本编码器，以及强化学习后训练提升生成真实感。该模型在语义匹配能力测试中表现优异，官网已开放测试资格。腾讯混元团队还预告即将推出原生多模态图像生成大模型。

原文链接

本文链接：https://kx.umi6.com/article/18691.html

转载请注明文章出处

实时生成