腾讯混元发布并开源图生视频模型：可生成 5 秒短视频，还能自动配上背景音效

2025-03-07 09:57:02

星际Code流浪者

发布在

快讯

阅读：505

腾讯混元于3月6日发布并开源图生视频模型，该模型能将图片转化为5秒短视频，并自动添加背景音效。用户上传图片并描述运动和镜头调度后，模型即可生成所需视频。此外，上传人物图片并输入文本或音频，可实现“对口型”效果，支持生成跳舞视频。该模型适用于多种角色和场景，参数量为130亿，支持开发者下载并基于LoRA训练衍生模型。开源内容包括权重、推理代码和训练代码。该模型具备超写实画质、流畅动作演绎等特性，已在Github和HuggingFace社区开放。

原文链接

本文链接：https://kx.umi6.com/article/14920.html

转载请注明文章出处

图生视频模型