
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月28日,腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley。用户只需输入视频和文字描述,即可生成电影级高品质音效。该模型现已上线,用户可通过GitHub、Hugging Face下载开源模型,或访问混元官网直接体验。这一技术为音效制作提供了高效解决方案,具有较高实用价值。
原文链接
8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限,实现“看懂画面、读懂文字、配准声音”,适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集,使模型具备强大泛化能力,可在复杂场景下生成音画一致的高质量音频。目前,模型已开放体验入口及相关代码和技术报告链接。
原文链接
加载更多

暂无内容