1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月12日,英伟达与麻省理工学院(MIT)联合推出Audio-SDS,这是一种基于文本条件的音频扩散模型扩展技术。研究人员首次将Score Distillation Sampling(SDS)技术应用于音频领域,无需依赖大规模特定数据集,即可实现FM合成器参数校准、物理冲击音合成及音源分离三大任务。Audio-SDS结合了预训练模型的生成能力与参数化音频表示,能通过高级文本提示调整相关参数。实验显示,该技术在主观听觉测试和多项客观指标上表现优异。尽管如此,模型覆盖范围、潜在伪影及优化敏感性等问题仍待解决。这项技术突破了传统音频生成模型的局限,为AI音效生成提供了新方向。

原文链接
本文链接:https://kx.umi6.com/article/18519.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Adobe 推出全新 AI 影视制作工具,可制作音效、模仿视频画面构图
2025-07-17 22:30:42
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
2025-05-13 14:52:15
中国模型打服硅谷:Airbnb联创CEO感叹又好又快又便宜!ChatGPT合作都拒了
2025-10-23 13:03:38
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
《GTA6》电臀舞玩法被辟谣:网友瞎编的 结果谷歌AI全信了
2025-10-22 18:52:05
三星在电视端首发 Perplexity AI 应用程序,带来更具创新性 AI 体验
2025-10-23 10:05:39
广达:今年已扩产8次仍供不应求 英伟达GB300产品11-12月进入主要放量期
2025-10-23 10:07:01
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
阿里夸克AI眼镜24日开启预售 3699元起
2025-10-23 19:13:38
强脑科技在成都设新公司 含AI相关业务
2025-10-23 14:07:29
讯兔科技完成超1亿元Pre-A轮融资,红杉中国、高瓴创投领投
2025-10-22 16:48:05
华尔街初级银行家瑟瑟发抖 OpenAI秘密项目将涉足投行业务
2025-10-22 15:47:47
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
2025-10-23 15:07:10
24小时热文
更多
扫一扫体验小程序