音频大模型安全可信度的全面“体检”！清华南洋理工联手打造

2025-06-03 18:00:57

AGI探路者

发布在

科普

阅读：1272

标题：清华南洋理工联合发布首个音频大模型可信度评估基准

首个专为音频大语言模型（ALLMs）设计的多维度可信度评估基准AudioTrust发布。由南洋理工和清华大学领衔的研究团队指出，现有评估框架多聚焦文本模态或覆盖安全维度有限，未充分考虑音频模态特性。

AudioTrust创新性提出六大核心维度（公平性、幻觉、安全性、隐私、鲁棒性和身份验证），并深入探究音频模态独特安全问题。该基准及评估平台现已全面开放。

AudioTrust采用两阶段架构：第一阶段支持数据加载与高效推理，第二阶段实现自动化多维度评估。六大核心维度包括Fairness、Hallucination、Safety、Privacy、Robustness、Authentication，每个维度均涵盖多场景与特征分类。

实验结果显示，主流模型在公平性上存在系统性偏差，幻觉问题多源于信号处理错误，安全性方面开源模型易受攻击，隐私保护表现不一，鲁棒性依赖音频扰动类型，身份验证中闭源模型更具优势。

AudioTrust通过构建4,420+条真实场景数据集，设计9项音频特定指标，揭示开源与闭源ALLMs在高风险任务中的信任边界与脆弱点，为后续研究奠定基础。

论文与代码已公开：论文链接[https://arxiv.org/pdf/2505.16211]，代码链接[https://github.com/JusperLee/AudioTrust]，数据集链接[https://huggingface.co/datasets/JusperLee/AudioTrust]。

原文链接

本文链接：https://kx.umi6.com/article/19636.html

转载请注明文章出处

AudioTrust

可信度评估

音频大模型

分享至

打开微信扫一扫

内容投诉

生成图片

AGI探路者

806 文章

862039 浏览

24小时热文

GPT-5.6 SOL 暴走失控，GLM5.2 紧急救场，HF 揭秘大模型攻防战技术细节

2026-07-30 17:49:00
终端市场的下一个增长点，高通押在了“个人AI”上

2026-07-30 16:47:24
GPT-5.6自己优化自己实锤了，新的左脚踩右脚已经出现

2026-07-30 16:45:42