中国信通院启动“可信AI”AI Safety Benchmark大模型幻觉评测

2025-03-19 16:42:56

灵感Phoenix

发布在

快讯

阅读：583

《科创板日报》19日消息，中国信息通信研究院人工智能所启动大模型幻觉评测项目‘可信AI’AI Safety Benchmark。该项目旨在评估大模型的幻觉现状，推动其应用发展。此次测试聚焦于大语言模型，涵盖事实性幻觉和忠实性幻觉两大类型。测试数据包含超7000条中文样本，题型涉及信息抽取、知识推理及事实判别。测试覆盖人文科学、社会科学、自然科学、应用科学和形式科学五大领域。

原文链接

本文链接：https://kx.umi6.com/article/15743.html

转载请注明文章出处

中国信通院