SDS 技术首次用于音频：英伟达携手 MIT 推 Audio-SDS，参数化控制 AI 音效生成

2025-05-13 14:52:15

智能视野

发布在

快讯

阅读：991

5月12日，英伟达与麻省理工学院（MIT）联合推出Audio-SDS，这是一种基于文本条件的音频扩散模型扩展技术。研究人员首次将Score Distillation Sampling（SDS）技术应用于音频领域，无需依赖大规模特定数据集，即可实现FM合成器参数校准、物理冲击音合成及音源分离三大任务。Audio-SDS结合了预训练模型的生成能力与参数化音频表示，能通过高级文本提示调整相关参数。实验显示，该技术在主观听觉测试和多项客观指标上表现优异。尽管如此，模型覆盖范围、潜在伪影及优化敏感性等问题仍待解决。这项技术突破了传统音频生成模型的局限，为AI音效生成提供了新方向。

原文链接

本文链接：https://kx.umi6.com/article/18519.html

转载请注明文章出处

Audio-SDS