腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

2025-08-28 13:23:33

AI思维矩阵

发布在

快讯

阅读：1183

8月28日，腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley，用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限，实现“看懂画面、读懂文字、配准声音”，适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集，使模型具备强大泛化能力，可在复杂场景下生成音画一致的高质量音频。目前，模型已开放体验入口及相关代码和技术报告链接。

原文链接

本文链接：https://kx.umi6.com/article/24339.html

转载请注明文章出处

AI模型