1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月23日,OpenAI员工指责xAI公司发布的Grok 3 AI模型基准测试结果具有误导性。xAI在博客中展示Grok 3在AIME 2025数学考试中的表现,声称超过OpenAI的o3-mini-high模型。但OpenAI员工指出,xAI未包括o3-mini-high在‘cons@64’条件下的得分,这种条件下模型尝试次数更多,可能提高分数。xAI联合创始人巴布什金否认误导行为,并指出OpenAI也曾发布类似图表。此外,有第三方重新绘制了更准确的图表,但仍有人质疑现有基准测试未能充分反映模型的真实性能和成本。

原文链接
本文链接:https://kx.umi6.com/article/14076.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 向软银集团旗下数字基础设施公司 SB Energy 投资 5 亿美元
2026-01-10 12:10:02
OpenAI 首席财务官:过去三年,公司收入、算力均累计增长约十倍
2026-01-19 16:03:05
消息称 OpenAI 大力研发音频 AI 模型,加紧备战首款“无屏幕”硬件设备
2026-01-02 00:44:25
软银集团完成对OpenAI的投资承诺
2025-12-31 09:09:06
马斯克“新战书”:xAI最早明年实现AGI 两三年内超越竞争对手!
2025-12-18 20:04:46
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
马斯克向OpenAI和微软索赔最高达1340亿美元
2026-01-18 15:28:06
OpenAI任命英国前财长奥斯本负责“OpenAI for Countries”项目
2025-12-17 08:30:53
黑客能让 AI 发辞职信?OpenAI 承认 Atlas 浏览器提示词注入攻击难以根治
2025-12-23 07:24:44
OpenAI正在物色新的风险防范主管
2025-12-29 15:35:54
屏幕消失之后:OpenAI的智能硬件新赌注
2026-01-21 08:59:13
消息称 OpenAI 考虑为 ChatGPT 内部版投放广告,收益存疑
2026-01-07 20:37:09
OpenAI:将自行承担“星际之门”项目能源费用
2026-01-21 12:08:12
24小时热文
更多
扫一扫体验小程序