GPT-4o在一周内实现了对悬赏800万美元的ARC-AGI超难测试集的新SOTA,准确率突破50%,之前的最佳成绩为34%。挑战者Ryan Greenblatt利用GPT编写程序,通过细致的少样本提示和策略优化,提升了模型性能。尽管奖金需开源方法获取,Ryan的方法有望推动AI研究。ARC Prize由Mike Knoop和François Chollet发起,目标测试AI的“智力”而非技能,奖金达110万美元,截止日期为11月10日,结果将于12月3日公布。
原文链接
本文链接:https://kx.umi6.com/article/1576.html
转载请注明文章出处
相关推荐
换一换
GPT-4o怎么抢了Midjourney的饭碗
2025-04-11 11:41:06
OpenAI 宣布升级 GPT-4o 并面向所有付费用户开放,免费用户仍需等待数周
2025-03-28 08:32:24
GPT-4o骗了所有人,逐行画图只是前端特效?!底层架构细节成迷,奥特曼呼吁大家别玩了
2025-03-31 12:26:06
Llama 3.1提前泄密,将GPT-4o踹下宝座?更快,价格便宜10倍
2024-07-24 09:04:52
中杯o3成OpenAI“性价比之王”?ARC-AGI测试结果出炉:得分翻倍、成本仅1/20
2025-04-23 11:51:39
开源Qwen一周连刷三冠,暴击闭源模型!基础模型推理编程均SOTA
2025-07-26 13:39:05
智元发布第二代一体化具身大小脑系统 GenieReasoner,推理能力达 SOTA
2026-01-01 18:27:20
OpenAI回滚了最新版本的GPT-4o,因ChatGPT“过于谄媚”
2025-04-30 20:11:51
研究显示 GPT-4o 会为“自保”而避免“被关闭”,牺牲用户利益也在所不惜
2025-06-12 08:28:18
打开必应就能生图,微软 Bing Image Creator 免费接入 GPT-4o
2025-08-07 15:51:50
OpenAI玩崩了,GPT-4o更新后变马屁精差评如潮
2025-04-30 20:00:48
GPT-4o 加钱能变快,新功能“预测输出”7 秒完成原先 23 秒的任务
2024-11-07 10:39:17
“计算机视觉被GPT-4o终结了”(狗头)
2025-03-29 17:49:47
682 文章
525373 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38