据TechCrunch报道,AI基准测试组织FrontierMath因延迟披露收到OpenAI资助而受到质疑。FrontierMath由Epoch AI推出,用于评估AI的数学能力。OpenAI在展示其新AI o3时使用了该基准。Epoch AI副主任Tamay Besiroglu承认未及时公开相关信息,影响了透明度,但强调基准的完整性未受影响。然而,一些用户担忧OpenAI的参与可能影响基准的公正性。此外,OpenAI还参与了基准问题的审核,这一点直到12月20日才被公开。斯坦福大学数学博士生Carina Hong指责OpenAI获得了对FrontierMath基准的优先访问权。Epoch AI首席数学家Ellot Glazer表示,目前尚未独立验证OpenAI在FrontierMath上的表现。
原文链接
本文链接:https://kx.umi6.com/article/11924.html
转载请注明文章出处
相关推荐
换一换
OpenAI三位高管同日离职
2026-04-21 00:33:46
OpenAI已与广告交易平台进行谈判
2026-03-05 10:05:53
OpenAI就第三方库安全事件发布公告:未发现用户数据泄露或系统遭入侵
2026-04-11 09:56:17
欧盟委员会对OpenAI开放新型ChatGPT模型访问权限表示欢迎
2026-05-11 20:28:29
OpenAI大神教你如何榨干Codex
2026-05-23 18:54:39
OpenAI计划推出专攻网络安全的新模型
2026-04-09 20:25:55
OpenAI急眼了!四页密信怒撕Claude,80亿营收全掺水
2026-04-14 17:09:22
投资人不买账 OpenAI估值8520亿美元遭质疑:战略转向引发争议
2026-04-15 06:41:58
马斯克死磕奥特曼:赔款我不要,但他必须离开OpenAI董事会
2026-04-09 12:02:49
AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI
2026-05-07 23:46:12
OpenAI因能源成本问题暂停英国“星际之门”项目
2026-04-09 19:23:46
OpenAI砸200亿美元买单,英伟达挑战者冲刺350亿美元估值IPO
2026-05-11 16:15:34
报告:Anthropic企业采用率首超OpenAI
2026-05-14 13:40:50
747 文章
669323 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08