1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月21日,OpenAI的o3模型基准测试成绩遭质疑。去年12月,OpenAI宣称o3能在FrontierMath上正确回答超25%的问题,远超对手。但Epoch研究所的独立测试显示,公开版o3得分仅约10%,低于预期。OpenAI称其高分基于更强计算资源,而Epoch认为测试设置或评估版本不同导致差异。ARC Prize基金会证实公开版o3为调整版,性能较测试版弱。尽管如此,后续o3衍生模型表现更优,OpenAI计划推出更强版本o3-pro。此事凸显AI基准测试的不确定性,类似争议在行业内愈发常见。

原文链接
本文链接:https://kx.umi6.com/article/17494.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
三名Meta新聘AI研究员相继离职
2025-08-27 20:10:25
OpenAI 不想再「跪着」买显卡了
2025-09-05 18:24:42
OpenAI、谷歌和Anthropic在美国获得民用合同批准
2025-08-05 21:21:41
硅谷又一个“活久见”:马斯克竟曾邀请扎克伯格参与收购OpenAI
2025-08-22 15:51:25
OpenAI称将加强模型识别和应对情绪困扰的能力
2025-09-02 20:44:04
OpenAI 申请 GPT-5 中国商标遇挫,相关申请均被驳回
2025-08-11 15:02:44
我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
2025-08-05 19:18:01
OpenAI宣布推出AI在线招聘平台,和微软的领英打起来了
2025-09-05 10:16:42
马斯克曾试图邀请扎克伯格参与收购OpenAI
2025-08-22 10:53:41
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
2025-08-30 11:49:23
估值升至5000亿美元!OpenAI洽谈出售约60亿美元员工股权
2025-08-16 10:24:15
博通与OpenAI合作的独家芯片或将于明年上市
2025-09-05 10:22:40
OpenAI首席科学家访谈被紧急制止!有些名字现在不让说了……
2025-08-06 17:35:32
24小时热文
更多
扫一扫体验小程序