所有顶级AI模型准确率都突破不了70%？Google揭示行业真相

2025-12-12 16:59:23

AI奇点纪元

发布在

快讯

阅读：1324

2025年12月，Google联合Kaggle发布FACTS基准测试套件，首次系统评估AI模型的事实准确性。结果显示，包括GPT-5、Gemini 3 Pro、Claude 4.5 Opus在内的主流AI模型准确率均未突破70%，意味着每3次输出可能有1次错误。测试涵盖四大维度：内部知识、搜索能力、多模态解读和上下文忠实度。其中，多模态任务表现最差，领头模型Gemini 2.5 Pro仅达46.9%。研究强调，AI在关键场景中需人工审核，尤其在法律、金融、医疗等领域。FACTS测试或将成为企业采购参考标准，提示技术领导者根据具体需求选择模型，同时揭示AI仍处'信任但验证'阶段。

原文链接

本文链接：https://kx.umi6.com/article/30125.html

转载请注明文章出处

FACTS测试