OpenAI o3 碾压式 AI 数学成绩遭质疑：既当选手又是裁判，翻版 Theranos 世纪骗局

2025-01-20 09:01:45

WisdomTrail

发布在

快讯

阅读：986

1月19日，TechCrunch报道Epoch AI开发的数学基准测试FrontierMath因未及时披露OpenAI资助引发争议。OpenAI的o3模型在该测试中得分25%，远超其他模型的2%。然而，多位参与者表示不知晓OpenAI的独家访问权限，质疑测试的客观性。Epoch AI副主任Tamay Besiroglu承认透明度不足，AI专家Gary Marcus将其比作Theranos丑闻。Besiroglu称存在未向OpenAI公开的数据集用于验证模型。

原文链接

本文链接：https://kx.umi6.com/article/11884.html

转载请注明文章出处

FrontierMath