1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月25日,Arc Prize基金会推出全新AI测试ARC-AGI-2,旨在更精准评估AI通用智能。目前多数AI模型在此测试中表现低迷,如OpenAI的o1-pro和DeepSeek的R1得分仅1%-1.3%,GPT-4.5等强模型得分约1%。相比之下,人类参与者组成的小组平均答对60%的问题。ARC-AGI-2通过复杂视觉谜题测试AI实时模式识别能力,避免单纯依赖计算资源。与ARC-AGI-1相比,新测试引入效率指标,强调技能获取和应用的经济性。尽管OpenAI的o3在ARC-AGI-1上曾达75.7%,但在ARC-AGI-2中即便投入200美元计算资源,得分仍仅为4%。此次测试引发行业关注,Arc Prize基金会计划2025年竞赛,目标是让AI在测试中达到85%准确率且单任务成本不超0.42美元。

原文链接
本文链接:https://kx.umi6.com/article/16104.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌最强模型 Gemini 3.0 被曝 10 月 22 日登场:延迟、成本更低,编程等性能更强
2025-10-15 09:32:44
看完最新国产AI写的公众号文章 我慌了
2025-12-10 18:05:25
模型免费、推理翻倍:Gemini 3 Flash 深夜炸场
2025-12-18 12:42:55
阿里巴巴旗下AI模型有效助力胰腺癌早筛
2026-01-06 17:20:22
没网也能用!谷歌发布离线机器人AI模型:具备视觉识别、语言理解能力
2025-06-26 17:02:10
谷歌前 CEO 施密特示警:AI 模型极容易被黑客利用
2025-10-11 09:58:07
浙江大学发布高精准基因组设计AI模型
2025-07-09 11:05:23
WAIC 2025 主论坛演讲 | MiniMax 创始人闫俊杰:每个人的 AI
2025-07-26 17:45:10
Kimi K2 高速版 AI 模型提速,输出速度最高可达每秒 100 Tokens
2025-08-22 16:51:22
英伟达CEO黄仁勋:未来十年世界上大部分汽车将实现自动驾驶或高度自动驾驶
2026-01-06 15:13:14
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
百度旗下基金等入股深朴智能 后者为AI模型技术研发商
2025-10-28 10:53:09
微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频,MAI-1-preview 剑指 Copilot 文本场景
2025-08-29 08:34:31
24小时热文
更多
扫一扫体验小程序