2月23日,OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现,声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出,xAI未包括o3-mini-high在‘cons@64’条件下的得分,这种条件下模型尝试次数更多,可能提高分数。xAI联合创始人巴布什金否认误导行为,并指出OpenAI也曾发布类似图表。此外,有第三方重新绘制了更准确的图表,但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。
原文链接
本文链接:https://kx.umi6.com/article/14076.html
转载请注明文章出处
相关推荐
.png)
换一换
消息称微软虽掌握 OpenAI 知识产权,但缺乏充分利用该技术的专业知识
2025-07-03 19:28:21
ChatGPT 化身生活操作系统:OpenAI 奥尔特曼预告下一代顶级 AI
2025-06-30 13:41:37
OpenAI 组织内部,到底是如何运作的?
2025-07-17 19:30:47
453 文章
90513 浏览
24小时热文
更多

-
2025-07-20 17:06:49
-
2025-07-20 16:05:44
-
2025-07-20 16:05:36