1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月25日,Arc Prize基金会推出全新AI测试ARC-AGI-2,旨在更精准评估AI通用智能。目前多数AI模型在此测试中表现低迷,如OpenAI的o1-pro和DeepSeek的R1得分仅1%-1.3%,GPT-4.5等强模型得分约1%。相比之下,人类参与者组成的小组平均答对60%的问题。ARC-AGI-2通过复杂视觉谜题测试AI实时模式识别能力,避免单纯依赖计算资源。与ARC-AGI-1相比,新测试引入效率指标,强调技能获取和应用的经济性。尽管OpenAI的o3在ARC-AGI-1上曾达75.7%,但在ARC-AGI-2中即便投入200美元计算资源,得分仍仅为4%。此次测试引发行业关注,Arc Prize基金会计划2025年竞赛,目标是让AI在测试中达到85%准确率且单任务成本不超0.42美元。

原文链接
本文链接:https://kx.umi6.com/article/16104.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元开源端到端 AI 模型 Hunyuan-Foley:视频 + 文字 =“电影级”音效
2025-08-28 13:23:33
OpenAI据悉完成了新AI模型的初步开发
2026-03-25 04:57:32
资金算力决定论下的「1%」例外
2025-12-09 10:28:45
OpenAI 3万亿美元测试,AI首战44个行业人类专家!
2025-09-27 15:43:00
AI大佬Karpathy焦虑了:作为程序员,我从未感到如此落后
2025-12-29 15:29:17
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
在训练中给人工智能一种邪恶的“疫苗”,可能会让它变得更好
2025-08-04 20:02:39
马斯克力挺 AMD:在中小型 AI 模型方面相当不错,暗示将降低对英伟达依赖
2025-09-13 16:27:30
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
百度旗下基金等入股深朴智能 后者为AI模型技术研发商
2025-10-28 10:53:09
阿里巴巴旗下AI模型有效助力胰腺癌早筛
2026-01-06 17:20:22
真格基金戴雨森 2025 AI 中场万字复盘
2025-07-29 10:28:18
严防死守!美国AI三巨头封杀中国模型蒸馏
2026-04-07 18:11:07
24小时热文
更多
扫一扫体验小程序