1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月23日,OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现,声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出,xAI未包括o3-mini-high在‘cons@64’条件下的得分,这种条件下模型尝试次数更多,可能提高分数。xAI联合创始人巴布什金否认误导行为,并指出OpenAI也曾发布类似图表。此外,有第三方重新绘制了更准确的图表,但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。

原文链接
本文链接:https://kx.umi6.com/article/14076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 收购个性化金融投资企业 Roi,强化消费者 AI 业务
2025-10-05 16:22:31
与OpenAI达成巨额算力基建协议 AMD股价盘前暴涨超20%
2025-10-06 20:40:34
OpenAI也缺卡!僧多粥少,自曝内部抢卡抢到发疯
2025-10-21 13:25:09
OpenAI和博通宣布战略合作 博通盘前涨12%
2025-10-13 22:04:43
鸿海科技台股大涨8% 董事长刘扬伟会晤OpenAI并计划对话英伟达
2025-10-16 13:55:20
如何为5年1万亿美元支出筹钱?OpenAI正探索更多可持续商业模式
2025-10-15 16:40:33
沃尔玛宣布与 OpenAI 合作,可在 ChatGPT 聊天中直接购物
2025-10-15 08:29:49
日立同 OpenAI 签署战略合作谅解备忘录,聚焦 AI 数据中心电力与能效
2025-10-03 10:38:53
OpenAI有花不完的钱?AI泡沫让人想起了当年的网络股
2025-10-15 08:31:01
120 亿年收入撬动 1 万亿美元订单:OpenAI 烧钱搞 AI 基建,奥尔特曼称短期内不优先考虑盈利
2025-10-09 09:09:35
OpenAI“解禁”成人内容,是福是祸?
2025-10-16 14:58:22
8 亿用户仅 5% 付费,OpenAI 急寻“钱路子”
2025-10-15 14:35:18
OpenAI推出小型语音模型GPT-5 Pro
2025-10-07 03:44:27
24小时热文
更多
扫一扫体验小程序