据TechCrunch报道,AI基准测试组织FrontierMath因延迟披露收到OpenAI资助而受到质疑。FrontierMath由Epoch AI推出,用于评估AI的数学能力。OpenAI在展示其新AI o3时使用了该基准。Epoch AI副主任Tamay Besiroglu承认未及时公开相关信息,影响了透明度,但强调基准的完整性未受影响。然而,一些用户担忧OpenAI的参与可能影响基准的公正性。此外,OpenAI还参与了基准问题的审核,这一点直到12月20日才被公开。斯坦福大学数学博士生Carina Hong指责OpenAI获得了对FrontierMath基准的优先访问权。Epoch AI首席数学家Ellot Glazer表示,目前尚未独立验证OpenAI在FrontierMath上的表现。
原文链接
本文链接:https://kx.umi6.com/article/11924.html
转载请注明文章出处
相关推荐
换一换
OpenAI发布ChatGPT健康 押注万亿AI医疗市场
2026-01-08 16:20:44
OpenAI或为亚马逊AI产品开发定制化模型
2026-02-04 22:10:24
OpenAI推出新平台 助力企业部署“AI同事”
2026-02-06 02:24:03
英伟达据悉接近达成协议在OpenAI最新一轮融资中投资200亿美元
2026-02-04 08:28:18
OpenAI 更新手机版 ChatGPT,现支持手动调节 AI“思考深度”
2025-12-30 09:10:29
英伟达、微软、亚马逊正就向OpenAI投资高达600亿美元事宜展开谈判
2026-01-29 11:26:08
OpenAI加码音频人工智能研发 备战首款硬件设备
2026-01-01 23:43:33
消息称 OpenAI 算力利润率攀升至 70%,相比去年底大幅增长
2025-12-22 07:26:28
不读博士,照样进OpenAI!o1核心成员现身说法了
2026-01-25 20:26:08
亚马逊据悉正在商谈向OpenAI投资高达500亿美元并扩大合作关系
2026-01-30 09:18:25
OpenAI家务机器人售价2万美元
2026-01-06 03:42:50
OpenAI拟运用AI助力药企研发并从中获利
2026-02-04 08:29:27
OpenAI 全面上线“廉价版”ChatGPT Go 订阅方案:每月 8 美元,将包含广告
2026-01-17 08:17:48
680 文章
460389 浏览
24小时热文
更多
-
2026-02-07 10:11:15 -
2026-02-07 10:10:09 -
2026-02-07 10:08:59