腾讯旗下混元图像2.0(Hunyuan Image 2.0)发布,实现毫秒级响应的“边说边画”实时文生图功能。用户可通过文字描述或语音输入生成图像,支持参考图特征提取及画面优化。此外,新增实时绘画板模式,结合手绘草图与文本描述生成图像。技术亮点包括更大模型参数、自研高压缩比图像编解码器、适配多模态大语言模型作为文本编码器,以及强化学习后训练提升生成真实感。该模型在语义匹配能力测试中表现优异,官网已开放测试资格。腾讯混元团队还预告即将推出原生多模态图像生成大模型。
原文链接
本文链接:https://kx.umi6.com/article/18691.html
转载请注明文章出处
相关推荐
换一换
李彦宏最新发声:大模型基本消除幻觉 AI变得可用可信赖!
2024-11-12 11:04:12
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒
2025-04-19 15:47:04
Karpathy都投的AI实时视频生成模型:直播立即转,无限时长零延迟
2025-07-19 14:53:50
鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了
2025-05-16 17:18:33
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
2025-03-12 14:26:26
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
Runway发布超逼真文生图模型—Frames
2024-11-28 10:22:21
谷歌最强文生图 AI 模型 Imagen 3 再进化:多样艺术风格、构图更平衡
2024-12-17 11:05:04
神秘 AI 模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
2024-10-29 14:31:02
ChatGPT文生图功能迎重大升级:准确生成文字 商用边界大幅拓展
2025-03-26 04:32:17
9个案例实测谷歌Gemini文生图,设计行业“快变天了”
2025-03-13 20:36:23
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
AI文生图最大问题不存在了,最新Gemini2.0指哪改哪
2025-03-14 15:16:12
628 文章
463008 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26