2026年1月24日,Anthropic宣布开源其内部技术笔试题,因Claude Opus 4.5模型在测试中全面超越人类工程师。该试题曾用于筛选顶尖性能工程师,但随着AI能力提升,传统笔试已无法区分人类与AI表现。Claude Opus 4.5在2小时内完成优化任务,甚至追平人类历史最高纪录。Anthropic尝试多次迭代考题,包括设计更复杂或‘分布外’问题,但均被AI攻克。公司现公开挑战:若有人类能在无限时间内击败Claude Opus 4.5的最佳表现(1363周期),可联系Anthropic。原版试题已发布至GitHub,供公众尝试。
原文链接
本文链接:https://kx.umi6.com/article/32118.html
转载请注明文章出处
相关推荐
换一换
Anthropic以每年1美元的价格向美国政府提供Claude企业版
2025-08-12 22:26:08
Anthropic 拟以 3500 亿美元估值再融资百亿,或为 IPO 蓄力
2026-01-08 07:56:38
Anthropic 发布 Claude Opus 4.5:强化编码与长任务处理,软件工程测试成绩超越人类
2025-11-25 07:35:44
Anthropic:国际员工将增长两倍 AI团队扩张五倍
2025-09-26 23:36:14
华人AI大神霸气离职:绝不接受反华
2025-10-11 10:27:25
OpenAI头号叛徒,竟然是自学的AI?
2025-08-22 16:48:45
英伟达和微软将向投资人工智能初创公司Anthropic合计投资至多150亿美元
2025-11-18 23:46:41
Anthropic 揭露全球首例“AI 自主网络攻击”事件,约 30 家企业机构受影响
2025-11-14 22:18:57
Anthropic宣布向AI基建投资500亿美元 “筑墙”迎战OpenAI
2025-11-13 02:36:27
Anthropic 宣布为 Claude 赋予“结束聊天”能力,以应对极少数用户不怀好意的情况
2025-08-17 16:37:59
Anthropic加码欧洲版图 新设巴黎与慕尼黑办公室
2025-11-07 19:06:15
华人AI大神霸气离职,一篇博客挑明中美大模型暗战
2025-10-11 10:14:30
Anthropic 定制 Claude 智能体“Claudius”频繁被员工骗钱:幻觉中坚信自己是人,还试图向 FBI 举报公司
2025-11-21 13:18:55
673 文章
458763 浏览
24小时热文
更多
-
2026-02-16 16:29:17 -
2026-02-16 12:19:15 -
2026-02-16 11:16:25