1月19日,TechCrunch报道Epoch AI开发的数学基准测试FrontierMath因未及时披露OpenAI资助引发争议。OpenAI的o3模型在该测试中得分25%,远超其他模型的2%。然而,多位参与者表示不知晓OpenAI的独家访问权限,质疑测试的客观性。Epoch AI副主任Tamay Besiroglu承认透明度不足,AI专家Gary Marcus将其比作Theranos丑闻。Besiroglu称存在未向OpenAI公开的数据集用于验证模型。
原文链接
本文链接:https://kx.umi6.com/article/11884.html
转载请注明文章出处
相关推荐
换一换
OpenAI:关于芯片供应 公司已做到“对未来需求心中有数”
2026-02-20 07:10:46
马斯克与OpenAI的恩怨情仇
2026-01-23 22:18:50
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
Ilya曝光70页OpenAI绝密文件
2026-04-07 10:47:37
OpenAI关停Sora真实原因曝光:烧钱无底洞 用户留不住
2026-03-31 18:00:04
OpenAI拟运用AI助力药企研发并从中获利
2026-02-04 08:29:27
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
OpenAI CEO发文感谢开发者引众怒!程序员痛斥:AI巨头对人类劳动用完即弃
2026-03-19 17:15:35
不读博士,照样进OpenAI!o1核心成员现身说法了
2026-01-25 20:26:08
Claude豪掷千万在美国春晚开撕OpenAI 奥特曼回击:伪君子
2026-02-05 20:09:29
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
OpenAI关停Sora!25个月从封神到退场
2026-03-25 09:11:16
OpenAI调整“星际之门”项目策略:暂缓自建 转向与甲骨文及软银深度合作
2026-02-24 13:54:26
696 文章
535865 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38