1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月23日,OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现,声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出,xAI未包括o3-mini-high在‘cons@64’条件下的得分,这种条件下模型尝试次数更多,可能提高分数。xAI联合创始人巴布什金否认误导行为,并指出OpenAI也曾发布类似图表。此外,有第三方重新绘制了更准确的图表,但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。

原文链接
本文链接:https://kx.umi6.com/article/14076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
塑料兄弟情!OpenAI怒斥苹果草率应付合作 反被苹果控诉挖走40名大将
2026-05-15 16:56:33
马斯克破大防了:私信求和遭拒,怒喷奥特曼Brockman「全美最恶人」
2026-05-06 12:44:44
Ilya曝光70页OpenAI绝密文件
2026-04-07 10:47:37
Eightco对OpenAI追加投资4000万美元
2026-03-20 21:05:44
菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题
2026-05-21 17:54:30
OpenAI连发两起安全事件!奥特曼住宅遭燃烧弹袭击:20岁男子扬言烧总部
2026-04-11 09:55:12
OpenAI智能体手机冲击明年量产 目标两年出货3000万部
2026-05-06 16:27:18
OpenAI计划推出专攻网络安全的新模型
2026-04-09 20:25:55
报告:Anthropic企业采用率首超OpenAI
2026-05-14 13:40:50
OpenAI首席财务官:公司或将筹集更多资金 未来可能考虑通过公开市场融资
2026-05-15 16:58:46
OpenAI关停Sora!25个月从封神到退场
2026-03-25 09:11:16
OpenAI CEO发文感谢开发者引众怒!程序员痛斥:AI巨头对人类劳动用完即弃
2026-03-19 17:15:35
上市前SpaceX业绩曝光 受xAI拖累2025年亏损近50亿美元
2026-04-10 16:25:32
24小时热文
更多
扫一扫体验小程序