1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月23日,OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现,声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出,xAI未包括o3-mini-high在‘cons@64’条件下的得分,这种条件下模型尝试次数更多,可能提高分数。xAI联合创始人巴布什金否认误导行为,并指出OpenAI也曾发布类似图表。此外,有第三方重新绘制了更准确的图表,但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。

原文链接
本文链接:https://kx.umi6.com/article/14076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
没博士没论文,这些人杀进AI大厂
2026-01-27 03:49:22
OpenAI关停Sora真实原因曝光:烧钱无底洞 用户留不住
2026-03-31 18:00:04
OpenAI与AWS达成协议 以竞标美国政府合同
2026-03-17 22:15:04
英伟达、微软、亚马逊正就向OpenAI投资高达600亿美元事宜展开谈判
2026-01-29 11:26:08
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
OpenAI正敲定1000亿美元巨额融资轮的首批投资承诺
2026-02-19 11:19:20
8500亿美元!OpenAI刷新AI公司估值纪录,领先第二名2.2倍
2026-02-20 18:37:00
马斯克xAI联创11跑10!仅剩特斯拉嫡系独苗留守
2026-03-26 13:59:26
OpenAI发布Windows版Codex应用
2026-03-05 10:04:49
加拿大校园枪击案枪手作案数月前曾与人工智能发生涉枪支暴力对话
2026-02-22 05:13:55
OpenAI 上市前夕管理层大地震!COO转岗 两位高管休假
2026-04-04 17:01:37
xAI计划在密西西比州建造一座天然气发电厂
2026-03-10 14:26:31
24小时热文
更多
扫一扫体验小程序