1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

北京时间4月17日,OpenAI发布多模态推理大模型o3,自称性能超越行业对手。然而,研究机构Epoch AI的第三方测试显示,o3在FrontierMath上的得分仅为10%,远低于OpenAI此前宣称的25%。Epoch AI认为,双方测试差异可能源于评估框架、测试时间和数据集的不同。此外,ARC Prize Foundation称公开版o3经过优化,性能不及预发布版本。基准测试争议正成为AI行业常态,近期xAI和Meta的模型也面临类似质疑。

原文链接
本文链接:https://kx.umi6.com/article/17500.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 奥尔特曼曾提议为全体英国人免费提供 ChatGPT Plus:潜在成本 20 亿英镑,后不了了之
2025-08-24 18:16:29
OpenAI,向所有反对者“举刀”
2025-09-05 19:23:16
OpenAI夺金IOI,但输给3位中国高中生
2025-08-12 10:13:40
OpenAI 推出印度专属低价订阅计划 ChatGPT Go,每月 399 卢比
2025-08-19 12:59:12
OpenAI被曝向千名员工“撒钱”留人
2025-08-08 17:17:16
GPT-5要来了?OpenAI官方预告引遐想 AI应用或迎来加速发展
2025-08-07 09:47:28
直播倒计时,OpenAI 最强模型 GPT-5 有望北京时间明日凌晨 1 点发布
2025-08-07 07:44:59
史上最大 AI 基建:OpenAI 将豪掷数万亿美元,打造“AI 宇宙工厂”
2025-08-16 17:28:15
四种变体可选:OpenAI 最强模型 GPT-5 宣传文案遭偷跑,增强代码质量 / 用户体验
2025-08-07 15:52:58
OpenAI发布开源模型“王者归来”,DeepSeek剧情会反转吗
2025-08-06 12:31:08
OpenAI单月营收破10亿美元,CFO坦言仍长期面临算力紧缺
2025-08-21 01:22:02
马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸
2025-08-13 11:31:43
xAI被“偷家”!马斯克暴怒 涉案前员工已跳槽OpenAI
2025-09-01 16:26:11
24小时热文
更多
扫一扫体验小程序