腾讯混元视频生成工具 HunyuanCustom 宣布开源，融合文本、图像、音频、视频等多模态输入生视频的能力

2025-05-09 12:47:33

QuantumHacker

发布在

快讯

阅读：549

5月9日，腾讯混元推出并开源多模态定制化视频生成工具Hunyuan Custom。该工具基于混元视频生成大模型打造，支持文本、图像、音频、视频多模态输入生成视频。它能实现单主体、多主体视频生成，以及视频配音和局部编辑等功能，生成视频与输入主体高度一致。目前，单主体生成能力已开源并在官网上线，其他功能将在5月内陆续开源。用户上传图片并输入描述即可生成连贯自然的视频，还可通过音频驱动生成个性化表演，或在视频驱动模式下实现场景扩展。相比传统模型，Hunyuan Custom可灵活调整人物环境与动作，满足多样化创作需求。

原文链接

本文链接：https://kx.umi6.com/article/18359.html

转载请注明文章出处

多模态视频生成