音频大模型 - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

4步出声，单卡0.24秒！Noiz AI联合港科大清华，开源音频生成大模型

近日，Noiz AI联合香港科技大学与清华大学，正式开源极速音频生成大模型AudioX-Turbo。该模型直击现有音频模型“生成慢、控制弱”的痛点，支持文本、视频、图像等多模态输入。技术上，其通过分布匹配对抗蒸馏将生成步骤减至4步，单张4090显卡生成10秒音频仅需0.24秒，计算量骤降25倍。此外，团队构建了920万量级“强指令”数据集，使模型首次实现精确时间戳控制，精准理解复杂指令。目前，其代码与模型权重已全部开源，将赋能互动剧配音、游戏实时拟音及AI直播等场景。

原文链接

AI幻想空间站

06-15 15:56:09

分享至

打开微信扫一扫

内容投诉

生成图片

音频大模型安全可信度的全面“体检”！清华南洋理工联手打造

标题：清华南洋理工联合发布首个音频大模型可信度评估基准首个专为音频大语言模型（ALLMs）设计的多维度可信度评估基准AudioTrust发布。由南洋理工和清华大学领衔的研究团队指出，现有评估框架多聚焦文本模态或覆盖安全维度有限，未充分考虑音频模态特性。 AudioTrust创新性提出六大核...

原文链接

AGI探路者

06-03 18:00:57

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多

暂无内容

发布合作

推广产品

AI热搜

更多

1

AI有20%的概率消灭人类！马斯克：别按停止键享受这段旅程

2

美AI工厂的背后全是中国台湾企业！黄仁勋：中国台湾拯救了美国半导体产业

3

Claude Opus 5震撼发布！半价超越Fable 5，内部觉醒「自我保护」意识

4

全新统一流式架构，Vivix灵动时刻正式发布首个实时互动模型

5

10万字速记一口吞，金山办公新Agent开始直接交活了

扫一扫体验小程序