8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,用户只需输入视频和文字即可生成电影级音效。该模型突破了AI视频“只能看不能听”的局限,实现“看懂画面、读懂文字、配准声音”,适用于短视频、电影、广告和游戏等领域。团队构建了10万小时高质量TV2A数据集,使模型具备强大泛化能力,可在复杂场景下生成音画一致的高质量音频。目前,模型已开放体验入口及相关代码和技术报告链接。
原文链接
本文链接:https://kx.umi6.com/article/24339.html
转载请注明文章出处
相关推荐
换一换
扎克伯格不挖人了?消息称 Meta 考虑采用 OpenAI 或谷歌的 AI 模型
2025-08-30 10:50:03
谷歌最强模型 Gemini 3.0 被曝 10 月 22 日登场:延迟、成本更低,编程等性能更强
2025-10-15 09:32:44
重新体验GPT-5后,我想它比GPT-4o 更需要一场葬礼
2025-08-11 19:06:36
谷歌前 CEO 施密特示警:AI 模型极容易被黑客利用
2025-10-11 09:58:07
阿里达摩院联合发布全球首个胃癌影像筛查 AI 模型 DAMO GRAPE
2025-06-25 19:33:44
挖人策略失灵了?Meta或已调整AI战略 产品有望引入外部模型
2025-08-30 17:55:22
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
2025-06-21 09:07:40
英伟达三大AI重磅产品齐发,GPU服务器性能暴增18倍
2025-08-13 16:37:45
觉醒第一步?OpenAI模型在研究中违抗命令,竟然篡改关机脚本
2025-05-26 22:57:10
港科大团队开发出新 AI 模型:2 至 4 张 X 光片构建 3D 影像,相比 CT 扫描辐射量降低 99%
2025-07-17 23:30:57
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
谷歌开源抗癌 AI 模型:模拟 4000 种药物后锁定潜在抗癌药
2025-10-16 14:56:03
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
2025-07-26 17:45:10
568 文章
335815 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52