1月19日,TechCrunch报道Epoch AI开发的数学基准测试FrontierMath因未及时披露OpenAI资助引发争议。OpenAI的o3模型在该测试中得分25%,远超其他模型的2%。然而,多位参与者表示不知晓OpenAI的独家访问权限,质疑测试的客观性。Epoch AI副主任Tamay Besiroglu承认透明度不足,AI专家Gary Marcus将其比作Theranos丑闻。Besiroglu称存在未向OpenAI公开的数据集用于验证模型。
原文链接
本文链接:https://kx.umi6.com/article/11884.html
转载请注明文章出处
相关推荐
换一换
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
消息称软银系深化与 OpenAI 合作,Arm 将为后者开发 CPU
2025-10-14 14:16:57
GPU警钟敲响,AI过热了?
2025-10-09 09:17:25
价值近万亿 微软获得OpenAI公司27%股权:AGI模型也有权用
2025-10-28 22:10:48
120 亿年收入撬动 1 万亿美元订单:OpenAI 烧钱搞 AI 基建,奥尔特曼称短期内不优先考虑盈利
2025-10-09 09:09:35
微软 Azure 推出业界首个生产级英伟达 GB300 NVL72 大型集群,顾客为 OpenAI
2025-10-11 10:01:36
OpenAI号称有花不完的钱!AI泡沫似曾相识 发人深思
2025-10-15 13:34:31
日立与OpenAI建立战略合作伙伴关系
2025-10-21 13:28:29
OpenAI有花不完的钱?AI泡沫让人想起了当年的网络股
2025-10-15 08:31:01
OpenAI“解禁”成人内容,是福是祸?
2025-10-16 14:58:22
不思进取的ChatGPT终于躺平了
2025-10-09 09:15:29
OpenAI拉拢「万亿俱乐部」
2025-10-14 15:18:42
OpenAI下订博通10GW定制芯片 AI巨头放言“这才是九牛一毛”
2025-10-14 08:11:43
543 文章
263185 浏览
24小时热文
更多
-
2025-10-29 09:43:24 -
2025-10-29 09:42:14 -
2025-10-29 09:41:06