1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

5月12日,英伟达与麻省理工学院(MIT)联合推出Audio-SDS,这是一种基于文本条件的音频扩散模型扩展技术。研究人员首次将Score Distillation Sampling(SDS)技术应用于音频领域,无需依赖大规模特定数据集,即可实现FM合成器参数校准、物理冲击音合成及音源分离三大任务。Audio-SDS结合了预训练模型的生成能力与参数化音频表示,能通过高级文本提示调整相关参数。实验显示,该技术在主观听觉测试和多项客观指标上表现优异。尽管如此,模型覆盖范围、潜在伪影及优化敏感性等问题仍待解决。这项技术突破了传统音频生成模型的局限,为AI音效生成提供了新方向。

原文链接
本文链接:https://kx.umi6.com/article/18519.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
2025-05-13 14:52:15
Adobe 推出全新 AI 影视制作工具,可制作音效、模仿视频画面构图
2025-07-17 22:30:42
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
无惧AI竞赛落后?华尔街评论员:苹果仅凭生态就握有“王牌”
2025-09-04 22:10:45
腾讯混元游戏 2.0 发布:图片秒变动画 / CG,全面开放使用
2025-09-05 17:21:54
Anthropic停服 智谱回应推出“Claude API 用户特别搬家计划”
2025-09-05 19:25:32
习近平向2025世界智能产业博览会致贺信
2025-09-05 10:23:48
诈骗专家自己都差点被骗,新加坡反欺诈大会呼吁警惕二维码、AI 等新型骗术
2025-09-04 22:08:23
阿里通义千问发布迄今最大模型——Qwen3-Max-Preview
2025-09-06 00:27:49
报道称DeepSeek计划年底前发布AI智能体 公司暂无回应
2025-09-04 17:05:24
字节发了个机器人全能大模型,带队人李航
2025-09-06 12:34:33
港科广×腾讯联手打造《我的世界》神操作,400张截图就能让AI挖矿通关,成本降至5%|EMNLP 2025
2025-09-04 19:05:34
告别海量标注!浙大团队提出GUI-RCPO,让GUI定位在无标签数据上自我进化
2025-09-05 13:20:04
24小时热文
更多
扫一扫体验小程序