1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,OpenAI的中杯o3模型在ARC-AGI推理测试中表现亮眼,得分达57%,成本仅为1.5美元/任务,相比第二名翻倍且成本仅为其1/20,成为当前OpenAI模型中的‘性价比之王’。该测试由ARC Prize官方组织,评估模型的推理能力。结果显示,o3在ARC-AGI-1测试中表现优异,但在升级版ARC-AGI-2中准确率未超3%。值得注意的是,此次的o3虽沿用旧名,但经过微调更适合聊天与产品应用,而非专为测试设计。相比去年12月发布的o3-preview,新版本在成本控制上有显著提升,但准确率有所下降。此外,高级推理设置下的o3(high)因成本高昂且效率较低,未能全面完成测试。ARC官方指出,早期响应的准确率更高,高级推理未必高效,且各版本间每秒token数差异不大。DeepSeek-R1在相同测试中得分仅为15.8%,逊色于o3。

原文链接
本文链接:https://kx.umi6.com/article/17614.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 正式上线 ChatGPT 群聊:最高支持 20 人,AI 也能参与头脑风暴
2025-11-21 09:09:27
AI 行业再现“闭环交易”:OpenAI 以资源换 Thrive Holdings 股权
2025-12-02 07:59:24
OpenAI的Stargate项目获得Blue Owl的30亿美元
2025-11-11 22:31:29
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
OpenAI 推出购物研究工具,ChatGPT 变身更懂你的 AI 购物小助手
2025-11-25 09:44:49
ChatGPT 诞生三年,OpenAI 还未取得绝对领先
2025-12-04 12:18:49
消息称 OpenAI 内部拉响“红色警报”:奥尔特曼亲自下令改进 ChatGPT,计划下周一发布新推理模型
2025-12-02 19:29:38
OpenAI大溃败!GPT-5「换皮」GPT-4o,两年半预训练0突破
2025-12-02 01:39:51
AI投资进入「下半场」
2025-11-13 15:03:01
自研 AI 芯片进展缓慢,微软 CEO 纳德拉计划借“OpenAI 之力”推进研发
2025-11-13 08:48:58
AI 生成的假视频泛滥,非营利组织要求 OpenAI 将 Sora 2 撤回
2025-11-12 17:15:19
OpenAI是“AI定海神针”?专家:它若倒了,科技巨头股价“腰斩”无人能逃!
2025-11-12 11:02:59
24小时热文
更多
扫一扫体验小程序