8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限,实现“看懂画面、读懂文字、配准声音”,适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集,使模型具备强大泛化能力,可在复杂场景下生成音画一致的高质量音频。目前,模型已开放体验入口及相关代码和技术报告链接。
原文链接
本文链接:https://kx.umi6.com/article/24339.html
转载请注明文章出处
相关推荐
.png)
换一换
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
2025-05-22 11:27:22
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
2025-07-05 16:00:44
谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI
2025-05-21 15:08:05
美亿万富翁投资人马克・库班呼吁:在 AI 模型上投放广告应被视作违法行为
2025-07-28 19:18:03
马斯克发布Grok 4,年费飚到2万+
2025-07-10 19:26:08
谷歌最强模型 Gemini 3.0 被曝 10 月 22 日登场:延迟、成本更低,编程等性能更强
2025-10-15 09:32:44
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
2025-09-10 13:34:35
2025年度最全面的AI报告:谁在赚钱,谁爱花钱,谁是草台班子
2025-10-13 17:00:38
AI混战日
2025-08-06 13:31:19
在训练中给人工智能一种邪恶的“疫苗”,可能会让它变得更好
2025-08-04 20:02:39
马斯克的最快AI模型来了
2025-09-16 12:09:37
马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?
2025-07-11 17:46:43
522 文章
246708 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07