据TechCrunch报道,AI基准测试组织FrontierMath因延迟披露收到OpenAI资助而受到质疑。FrontierMath由Epoch AI推出,用于评估AI的数学能力。OpenAI在展示其新AI o3时使用了该基准。Epoch AI副主任Tamay Besiroglu承认未及时公开相关信息,影响了透明度,但强调基准的完整性未受影响。然而,一些用户担忧OpenAI的参与可能影响基准的公正性。此外,OpenAI还参与了基准问题的审核,这一点直到12月20日才被公开。斯坦福大学数学博士生Carina Hong指责OpenAI获得了对FrontierMath基准的优先访问权。Epoch AI首席数学家Ellot Glazer表示,目前尚未独立验证OpenAI在FrontierMath上的表现。
原文链接
本文链接:https://kx.umi6.com/article/11924.html
转载请注明文章出处
相关推荐
换一换
另有其人:OpenAI 并非博通 100 亿美元 AI 大单神秘客户
2025-10-14 13:16:37
OpenAI 放宽 ChatGPT 成人内容引争议,奥尔特曼回应称“我们不是世界道德警察”
2025-10-16 10:51:00
OpenAI产品线拉出来吓我一跳,奥特曼不愧是YC出身
2025-10-27 15:02:13
OpenAI做电商,国内谁会跟进?
2025-10-16 16:58:57
OpenAI:目前ChatGPT每周用户数量已达8亿
2025-10-07 05:45:44
OpenAI掌舵人三年演讲梳理:一文读懂Altman
2025-10-22 18:50:58
无惧加码还是箭难回头?消息称软银已批准对OpenAI追加225亿美元投资
2025-10-27 11:59:16
消息称软银系深化与 OpenAI 合作,Arm 将为后者开发 CPU
2025-10-14 14:16:57
巨额采购订单不断,OpenAI“停不下来”
2025-10-14 10:15:04
OpenAI和博通宣布战略合作 博通盘前涨12%
2025-10-13 22:04:43
微软 Azure 推出业界首个生产级英伟达 GB300 NVL72 大型集群,顾客为 OpenAI
2025-10-11 10:01:36
进军聊天软件市场?曝 OpenAI 正测试 ChatGPT 私聊功能
2025-10-16 18:59:26
马上,OpenAI就会成为最大的无人公司
2025-10-13 07:54:55
577 文章
284435 浏览
24小时热文
更多
-
2025-10-29 09:43:24 -
2025-10-29 09:42:14 -
2025-10-29 09:41:06