因延后披露受 OpenAI 资助事实，AI 基准测试组织 FrontierMath 被质疑行为不当

2025-01-20 22:26:27

智能涌动

发布在

快讯

阅读：689

据TechCrunch报道，AI基准测试组织FrontierMath因延迟披露收到OpenAI资助而受到质疑。FrontierMath由Epoch AI推出，用于评估AI的数学能力。OpenAI在展示其新AI o3时使用了该基准。Epoch AI副主任Tamay Besiroglu承认未及时公开相关信息，影响了透明度，但强调基准的完整性未受影响。然而，一些用户担忧OpenAI的参与可能影响基准的公正性。此外，OpenAI还参与了基准问题的审核，这一点直到12月20日才被公开。斯坦福大学数学博士生Carina Hong指责OpenAI获得了对FrontierMath基准的优先访问权。Epoch AI首席数学家Ellot Glazer表示，目前尚未独立验证OpenAI在FrontierMath上的表现。

原文链接

本文链接：https://kx.umi6.com/article/11924.html

转载请注明文章出处

FrontierMath