谷歌DeepMind近期发布新研究,开发出"video-to-audio" AI技术,可为无声视频自动生成背景音乐。目前模型需用户输入提示词引导,如指定场景和音效类型,能生成无限量协调音轨并判断音频情感倾向。团队目标是未来实现无提示词自动配音及提升角色对话口型同步,持续优化中。这一创新发生于6月18日,展示了AI在多媒体创作领域的最新进展。
原文链接
本文链接:https://kx.umi6.com/article/1599.html
转载请注明文章出处
相关推荐
.png)
换一换
Meta 发布 3D Gen AI 模型:1 分钟内生成高质量 3D 内容
2024-07-03 14:42:24
谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
2025-04-05 07:55:42
银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道
2024-07-26 10:41:59
谷歌 DeepMind 机器人 AI 模型实现本地化运行:可完成系鞋带等高难度任务
2025-06-25 00:23:19
谷歌 DeepMind 新研究:利用 AI 模型为无声视频配音
2024-06-18 23:13:28
谷歌 DeepMind 展示 GenRM 技术:微调 LLMs 作为奖励模型,提升生成式 AI 推理能力
2024-09-03 07:29:38
谷歌 DeepMind 发布 AlphaGenome 模型:AI 新视角探索 DNA 基因变异影响
2025-06-26 09:57:00
90/270 亿参数,谷歌发布 Gemma 2 开源 AI 模型:性能力压同级、单 A100 / H100 GPU 可运行
2024-06-28 09:25:07
高盛:由于美联储预期降息 预计到2026年中期标普500指数将上涨6%
2025-09-08 15:00:28
躺不平的企业微信
2025-09-06 10:32:35
Anthropic突然封锁中国企业,我们该从中学到什么?
2025-09-06 11:33:57
Hinton万万没想到,前女友用ChatGPT跟他闹分手
2025-09-08 17:02:02
一键照片“手办化”:谷歌 Gemini 上线“Nano Banana”文生图模型,无需访问 AI Studio
2025-09-06 22:39:24
495 文章
167370 浏览
24小时热文
更多

-
2025-09-08 23:04:48
-
2025-09-08 22:04:30
-
2025-09-08 21:06:20