1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4步出声,单卡0.24秒!Noiz AI联合港科大清华,开源音频生成大模型
近日,Noiz AI联合香港科技大学与清华大学,正式开源极速音频生成大模型AudioX-Turbo。该模型直击现有音频模型“生成慢、控制弱”的痛点,支持文本、视频、图像等多模态输入。技术上,其通过分布匹配对抗蒸馏将生成步骤减至4步,单张4090显卡生成10秒音频仅需0.24秒,计算量骤降25倍。此外,团队构建了920万量级“强指令”数据集,使模型首次实现精确时间戳控制,精准理解复杂指令。目前,其代码与模型权重已全部开源,将赋能互动剧配音、游戏实时拟音及AI直播等场景。
AI幻想空间站
06-15 15:56:09
分享至
打开微信扫一扫
内容投诉
生成图片
音频大模型安全可信度的全面“体检”!清华南洋理工联手打造
标题:清华南洋理工联合发布首个音频大模型可信度评估基准 首个专为音频大语言模型(ALLMs)设计的多维度可信度评估基准AudioTrust发布。由南洋理工和清华大学领衔的研究团队指出,现有评估框架多聚焦文本模态或覆盖安全维度有限,未充分考虑音频模态特性。 AudioTrust创新性提出六大核...
AGI探路者
06-03 18:00:57
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序