5月12日,英伟达与麻省理工学院(MIT)联合推出Audio-SDS,这是一种基于文本条件的音频扩散模型扩展技术。研究人员首次将Score Distillation Sampling(SDS)技术应用于音频领域,无需依赖大规模特定数据集,即可实现FM合成器参数校准、物理冲击音合成及音源分离三大任务。Audio-SDS结合了预训练模型的生成能力与参数化音频表示,能通过高级文本提示调整相关参数。实验显示,该技术在主观听觉测试和多项客观指标上表现优异。尽管如此,模型覆盖范围、潜在伪影及优化敏感性等问题仍待解决。这项技术突破了传统音频生成模型的局限,为AI音效生成提供了新方向。
原文链接
本文链接:https://kx.umi6.com/article/18519.html
转载请注明文章出处
相关推荐
换一换
Adobe 推出全新 AI 影视制作工具,可制作音效、模仿视频画面构图
2025-07-17 22:30:42
德银警示氦气供应风险
2026-04-24 17:27:38
香港科创标杆奖项!商汤首席科学家林达华荣获中银香港科创奖
2026-04-22 18:21:40
OpenAI正式发布GPT-5.5
2026-04-24 09:02:17
昆仑万维2025年营收同比增长44.78%至81.98亿 “4+3”战略构建AI Native平台经济新范式
2026-04-23 21:31:07
英伟达参投Vast Data新一轮融资 估值升至300亿美元
2026-04-23 06:52:02
斑马智能接入支付宝AI付车载版 打通AI座舱“支付即服务”
2026-04-24 17:25:23
阿里云百炼上线DeepSeek-V4
2026-04-24 20:31:56
摩尔线程Day-0适配DeepSeek-V4
2026-04-24 18:28:12
打击P图恶意骗退款!淘宝天猫上线售后AI假图识别模型
2026-04-23 19:25:25
豆神教育联合微软Azure推出AI短剧平台
2026-04-24 09:05:36
Mobileye 2026财年一季度营收增长27%,自动驾驶商业化进程持续推进
2026-04-24 18:24:51
CPU“严重供不应求” 供应链称国际大厂酝酿Q3再涨价
2026-04-23 16:19:37
722 文章
563163 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38