1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,OpenAI的中杯o3模型在ARC-AGI推理测试中表现亮眼,得分达57%,成本仅为1.5美元/任务,相比第二名翻倍且成本仅为其1/20,成为当前OpenAI模型中的‘性价比之王’。该测试由ARC Prize官方组织,评估模型的推理能力。结果显示,o3在ARC-AGI-1测试中表现优异,但在升级版ARC-AGI-2中准确率未超3%。值得注意的是,此次的o3虽沿用旧名,但经过微调更适合聊天与产品应用,而非专为测试设计。相比去年12月发布的o3-preview,新版本在成本控制上有显著提升,但准确率有所下降。此外,高级推理设置下的o3(high)因成本高昂且效率较低,未能全面完成测试。ARC官方指出,早期响应的准确率更高,高级推理未必高效,且各版本间每秒token数差异不大。DeepSeek-R1在相同测试中得分仅为15.8%,逊色于o3。

原文链接
本文链接:https://kx.umi6.com/article/17614.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI据悉考虑与北约签订合同
2026-03-04 14:47:17
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
OpenAI 上市前夕管理层大地震!COO转岗 两位高管休假
2026-04-04 17:01:37
GPT-5.4意外泄露!OpenAI最新模型瞄准这2大能力突围
2026-03-03 19:25:38
OpenAI关停Sora 奥尔特曼坦言:为了下一代AI 集中计算资源
2026-04-07 20:16:56
刚被媒体曝黑料 豪宅又被人爆弹 OpenAI CEO回应:气得要命
2026-04-11 14:03:36
给「对手」的钱比给「盟友」多,亚马逊疯了吗?
2026-04-30 12:20:19
AI新王诞生!Anthropic估值冲爆1.2万亿 首次反超OpenAI
2026-05-07 23:46:12
1220亿美元!OpenAI创下史上最大单笔融资纪录
2026-04-01 09:34:49
AI Agent的门票 MiniMax想先打下来
2026-06-04 17:17:31
Sora负责人离职
2026-04-18 07:48:11
OpenAI与微软“离婚”了 反目成仇还是好聚好散
2026-04-29 00:47:40
马斯克起诉OpenAI OpenAI上市计划或遇重创
2026-04-28 17:29:04
24小时热文
更多
扫一扫体验小程序