1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

北京时间4月17日,OpenAI发布多模态推理大模型o3,自称性能超越行业对手。然而,研究机构Epoch AI的第三方测试显示,o3在FrontierMath上的得分仅为10%,远低于OpenAI此前宣称的25%。Epoch AI认为,双方测试差异可能源于评估框架、测试时间和数据集的不同。此外,ARC Prize Foundation称公开版o3经过优化,性能不及预发布版本。基准测试争议正成为AI行业常态,近期xAI和Meta的模型也面临类似质疑。

原文链接
本文链接:https://kx.umi6.com/article/17500.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 推出网页浏览器 Atlas 后,谷歌股价一度下跌 3%
2025-10-22 11:45:19
不止于 HBM 内存供应,三星、SK 均与 OpenAI 达成多角度 AI 战略合作伙伴关系
2025-10-02 10:07:51
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
AMD首席财务官胡锦:与OpenAI合作预计将为公司带来数百亿美元收入
2025-10-07 10:50:10
存储巨头狂欢持续!与OpenAI达成合作后 三星、SK海力士股价飙升
2025-10-02 11:10:25
OpenAI做电商,国内谁会跟进?
2025-10-16 16:58:57
与OpenAI达成巨额算力基建协议 AMD股价盘前暴涨超20%
2025-10-06 20:40:34
OpenAI投资AMD,股价一夜暴涨千亿
2025-10-07 08:47:28
OpenAI再造爆款?AI视频社交应用Sora问鼎苹果热门App榜单
2025-10-04 00:49:30
进军聊天软件市场?曝 OpenAI 正测试 ChatGPT 私聊功能
2025-10-16 18:59:26
消息称 OpenAI 与前苹果首席设计师 Jony Ive 合作开发 AI 设备遇技术挑战:算力不足、正解决对话自然性
2025-10-07 07:48:05
鸿海科技台股大涨8% 董事长刘扬伟会晤OpenAI并计划对话英伟达
2025-10-16 13:55:20
Lilian Weng最新对话:首谈离开OpenAI创业,以及AI研究的现实扭曲场
2025-10-19 14:49:39
24小时热文
更多
扫一扫体验小程序