8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限,实现“看懂画面、读懂文字、配准声音”,适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集,使模型具备强大泛化能力,可在复杂场景下生成音画一致的高质量音频。目前,模型已开放体验入口及相关代码和技术报告链接。
原文链接
本文链接:https://kx.umi6.com/article/24339.html
转载请注明文章出处
相关推荐
.png)
换一换
这个AI精准模拟人类行为大脑状态,上Nature了
2025-07-15 17:48:52
从分钟到秒级:Meta Space Llama 模型登陆国际空间站,刷新太空 AI 速度
2025-04-26 09:39:29
卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木
2025-05-09 22:57:27
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280
2025-04-08 23:18:28
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
在训练中给人工智能一种邪恶的“疫苗”,可能会让它变得更好
2025-08-04 20:02:39
日本开发出可预测卵巢功能的AI模型
2025-07-20 21:10:03
新AI模型助力更准确预测心源性猝死风险
2025-07-05 16:01:14
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
2025-07-05 16:00:44
Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜
2025-06-23 15:25:53
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
OpenAI 新规:组织想要用未来 AI 模型需先“验明正身”
2025-04-14 08:20:45
OpenAI 的“iPhone 时刻”:奥尔特曼称 GPT-5 是全球最佳写作、编程 AI 模型,免费 ChatGPT 用户也能体验
2025-08-08 03:00:19
467 文章
128615 浏览
24小时热文
更多

-
2025-08-28 18:26:07
-
2025-08-28 17:30:42
-
2025-08-28 17:29:50