OpenAI 员工公开指责 xAI：Grok 3 基准测试结果具有误导性

2025-02-23 09:54:15

量子思考者

发布在

快讯

阅读：974

2月23日，OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现，声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出，xAI未包括o3-mini-high在‘cons@64’条件下的得分，这种条件下模型尝试次数更多，可能提高分数。xAI联合创始人巴布什金否认误导行为，并指出OpenAI也曾发布类似图表。此外，有第三方重新绘制了更准确的图表，但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。

原文链接

本文链接：https://kx.umi6.com/article/14076.html

转载请注明文章出处

Grok 3