1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,Noiz AI联合香港科技大学与清华大学,正式开源极速音频生成大模型AudioX-Turbo。该模型直击现有音频模型“生成慢、控制弱”的痛点,支持文本、视频、图像等多模态输入。技术上,其通过分布匹配对抗蒸馏将生成步骤减至4步,单张4090显卡生成10秒音频仅需0.24秒,计算量骤降25倍。此外,团队构建了920万量级“强指令”数据集,使模型首次实现精确时间戳控制,精准理解复杂指令。目前,其代码与模型权重已全部开源,将赋能互动剧配音、游戏实时拟音及AI直播等场景。

原文链接
本文链接:https://kx.umi6.com/article/36536.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
音频大模型安全可信度的全面“体检”!清华南洋理工联手打造
2025-06-03 18:00:57
华硕ProArt AI专业创作本助阵上海国际电影节“AI片场” 共筑AI影像创作新生态
2026-06-15 11:49:45
谷歌推出DiffusionGemma文本扩散AI模型:本地AI推理速度提4倍
2026-06-11 18:54:12
搬石砸脚!Anthropic两款旗舰AI大模型发布仅3天即被禁
2026-06-13 13:22:45
AI误判致美国男子含冤入狱三月 人生坠入“斩杀线”
2026-06-10 01:48:40
模型替换、数据倒卖、远控后门!国安部提醒“AI中转站”风险
2026-06-08 08:15:08
一句话就能P图发朋友圈!美图秀秀官宣首批接入微信AI生态
2026-06-10 16:20:07
让机器人行动更有依据:复旦等提出 GuidedVLA,提升 VLA 可控可解释能力
2026-06-08 11:27:33
2026奇点智能产品大会首批嘉宾官宣:在 AI 的“可交付的时代”,看一线专家如何拆解真实落地闭环!
2026-06-12 16:37:04
CVPR 开幕式:全场泪目缅怀孙剑,广工本科生靠「古董显卡」逆袭 | CVPR 2026
2026-06-08 11:22:26
未来拼什么 微软CEO:用好AI串联各类资源是关键
2026-06-15 18:04:43
造谣小米员工破坏展车、AI伪造事故视频!两名网络用户公开道歉
2026-06-08 18:42:21
Claude Fable 5省钱秘诀来了:调成Low档比Opus更便宜
2026-06-11 16:47:48
24小时热文
更多
扫一扫体验小程序