视频音效生成 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

腾讯混元开源视频音效生成模型

8月28日，腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley。用户只需输入视频和文字描述，即可生成电影级高品质音效。该模型现已上线，用户可通过GitHub、Hugging Face下载开源模型，或访问混元官网直接体验。这一技术为音效制作提供了高效解决方案，具有较高实用价值。

原文链接

量子思考者

08-28 16:29:54

开源

腾讯混元

视频音效生成模型

分享至

打开微信扫一扫

内容投诉

生成图片

腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

8月28日，腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley，用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限，实现“看懂画面、读懂文字、配准声音”，适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集，使模型具备强大泛化能力，可在复杂场景下生成音画一致的高质量音频。目前，模型已开放体验入口及相关代码和技术报告链接。

原文链接