Hunyuan-Foley - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

腾讯混元开源端到端 AI 模型 Hunyuan-Foley：视频 + 文字 =“电影级”音效

8月28日，腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley，用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限，实现“看懂画面、读懂文字、配准声音”，适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集，使模型具备强大泛化能力，可在复杂场景下生成音画一致的高质量音频。目前，模型已开放体验入口及相关代码和技术报告链接。

原文链接