“人类终极考试”基准测试发布：顶级 AI 系统表现惨淡，回答准确率均未超 10%

2025-01-24 16:45:09

神经网络领航员

发布在

快讯

阅读：1108

非营利组织‘人工智能安全中心’（CAIS）与Scale AI联合推出‘人类终极考试’基准测试，评估AI系统的综合能力。该测试由全球500多个机构的近1000名专家设计，涵盖多领域复杂题型。初步结果显示，所有公开旗舰AI系统准确率均未超10%，暴露了AI在综合性问题上的不足。CAIS和Scale AI计划将测试向研究社区开放，以进一步评估新模型。测试于1月24日发布。

原文链接

本文链接：https://kx.umi6.com/article/12152.html

转载请注明文章出处

AI系统