8月28日,腾讯混元宣布开源端到端视频音效生成模型HunyuanVideo-Foley。用户只需输入视频和文字描述,即可生成电影级高品质音效。该模型现已上线,用户可通过GitHub、Hugging Face下载开源模型,或访问混元官网直接体验。这一技术为音效制作提供了高效解决方案,具有较高实用价值。
原文链接
本文链接:https://kx.umi6.com/article/24360.html
转载请注明文章出处
相关推荐
换一换
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
腾讯混元 Voyager3D 世界模型发布,可生成长距离、世界一致的漫游场景
2025-09-02 17:35:42
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
腾讯混元升级AI绘画微调范式,在整个扩散轨迹上优化,人工评估分数提升300%
2025-09-15 14:55:48
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
601 文章
381384 浏览
24小时热文
更多
-
2025-12-08 19:45:13 -
2025-12-08 19:43:05 -
2025-12-08 18:41:52