1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

近日,OpenAI的中杯o3模型在ARC-AGI推理测试中表现亮眼,得分达57%,成本仅为1.5美元/任务,相比第二名翻倍且成本仅为其1/20,成为当前OpenAI模型中的‘性价比之王’。该测试由ARC Prize官方组织,评估模型的推理能力。结果显示,o3在ARC-AGI-1测试中表现优异,但在升级版ARC-AGI-2中准确率未超3%。值得注意的是,此次的o3虽沿用旧名,但经过微调更适合聊天与产品应用,而非专为测试设计。相比去年12月发布的o3-preview,新版本在成本控制上有显著提升,但准确率有所下降。此外,高级推理设置下的o3(high)因成本高昂且效率较低,未能全面完成测试。ARC官方指出,早期响应的准确率更高,高级推理未必高效,且各版本间每秒token数差异不大。DeepSeek-R1在相同测试中得分仅为15.8%,逊色于o3。

原文链接
本文链接:https://kx.umi6.com/article/17614.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
解码OpenAI的2026
2026-02-04 02:07:37
“红色警报”奏效吗 OpenAI称霸企业级AI市场 碾压谷歌
2026-01-16 19:53:11
又一个谷歌不作恶式的形象崩塌 OpenAI删除AI安全造福人类承诺
2026-02-14 22:47:09
光顾赚钱不搞研究,OpenAI元老级高管现离职潮,Mark Chen紧急回应
2026-02-04 15:48:22
黄仁勋反悔,不投千亿美元给OpenAI了?
2026-02-03 02:13:44
DeepMind CEO:对OpenAI引入广告感到惊讶 Gemini目前没这种计划
2026-01-23 15:00:51
OpenAI据悉正在开发一款对标苹果AirPods的人工智能设备
2026-01-14 15:44:46
教科书《性能之巅》作者入职OpenAI!迷弟总裁亲自欢迎
2026-02-08 14:07:29
算力越高收入越多!OpenAI率先验证AI商业Scaling Law
2026-01-20 11:02:06
OpenAI发布Windows版Codex应用
2026-03-05 10:04:49
英伟达、微软、亚马逊正就向OpenAI投资高达600亿美元事宜展开谈判
2026-01-29 11:26:08
马斯克诉OpenAI案将于4月下旬进入审判程序
2026-01-16 11:33:52
OpenAI推出首款搭载英伟达竞争对手Cerebras芯片的AI模型
2026-02-13 02:57:22
24小时热文
更多
扫一扫体验小程序