1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:清华南洋理工联合发布首个音频大模型可信度评估基准

首个专为音频大语言模型(ALLMs)设计的多维度可信度评估基准AudioTrust发布。由南洋理工和清华大学领衔的研究团队指出,现有评估框架多聚焦文本模态或覆盖安全维度有限,未充分考虑音频模态特性。

AudioTrust创新性提出六大核心维度(公平性、幻觉、安全性、隐私、鲁棒性和身份验证),并深入探究音频模态独特安全问题。该基准及评估平台现已全面开放。

AudioTrust采用两阶段架构:第一阶段支持数据加载与高效推理,第二阶段实现自动化多维度评估。六大核心维度包括Fairness、Hallucination、Safety、Privacy、Robustness、Authentication,每个维度均涵盖多场景与特征分类。

实验结果显示,主流模型在公平性上存在系统性偏差,幻觉问题多源于信号处理错误,安全性方面开源模型易受攻击,隐私保护表现不一,鲁棒性依赖音频扰动类型,身份验证中闭源模型更具优势。

AudioTrust通过构建4,420+条真实场景数据集,设计9项音频特定指标,揭示开源与闭源ALLMs在高风险任务中的信任边界与脆弱点,为后续研究奠定基础。

论文与代码已公开:论文链接[https://arxiv.org/pdf/2505.16211],代码链接[https://github.com/JusperLee/AudioTrust],数据集链接[https://huggingface.co/datasets/JusperLee/AudioTrust]。

原文链接
本文链接:https://kx.umi6.com/article/19636.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
音频大模型安全可信度的全面“体检”!清华南洋理工联手打造
2025-06-03 18:00:57
“办事”成全球AI新焦点:谷歌OpenAI相继投入 千问再加码
2026-03-06 18:25:27
《政府工作报告》起草组成员陈昌盛:进一步实施建设超大规模的智算集群和算电协同的新型基础设施建设
2026-03-05 16:33:06
OpenAI发布Windows版Codex应用
2026-03-05 10:04:49
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
无垠拓界 基筑未来|无问智科重磅发布业界首个物理AI数据基座平台
2026-03-06 15:07:52
特斯拉最牛散户斥资1.8亿美元买100万股英伟达:力挺AI赛道
2026-03-05 17:38:25
政府工作报告:促进新一代智能终端和智能体加快推广
2026-03-05 10:08:07
谷歌DeepMind高管公开邀请千问团队入职
2026-03-05 15:31:45
阿里千问大模型技术负责人自宣卸任
2026-03-04 09:27:14
OpenAI据悉考虑与北约签订合同
2026-03-04 14:47:17
恶搞马斯克的App 是个披着短视频外衣的4399?
2026-03-05 07:52:19
阿里批准林俊旸离职,CTO周靖人接管千问!Gemini周浩确定加盟
2026-03-05 13:14:03
24小时热文
更多
扫一扫体验小程序