
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限,实现“看懂画面、读懂文字、配准声音”,适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集,使模型具备强大泛化能力,可在复杂场景下生成音画一致的高质量音频。目前,模型已开放体验入口及相关代码和技术报告链接。
原文链接
加载更多

暂无内容