
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,在AtCoder世界巡回总决赛上,人类选手Psycho经过10小时激战,两次反超OpenAI-AHC模型,最终夺得编程冠军。比赛历时两天,12名顶尖选手参与角逐,OpenAI在大部分时间保持领先,但在最后关头被Psycho超越,屈居第二。Psycho表示,为获胜他三天仅睡10小时,疲惫不堪。有趣的是,他曾效力于OpenAI,参与训练击败人类的AI系统。此次比赛由OpenAI赞助,冠军奖金50万日元(约合2.4万元人民币)。OpenAI总裁Greg Brockman发来祝贺,并调侃称‘生活更有趣了’。网友戏称这或许是人类最后一次胜利。
原文链接
2025年7月16日,AtCoder World Tour Finals 2025编程竞赛在东京举行,人类选手Psyho在启发式赛道中险胜OpenAI,夺得第一。比赛持续10小时,OpenAI曾一度领先,但Psyho在最后46分钟完成反超,锁定胜局。这场胜利被视为人类在AI崛起时代的短暂高光时刻,尽管参赛者和观众普遍认为,AI未来将无可避免地超越人类。此次比赛不仅是一场技术较量,更象征着人类与AI的对抗进入新阶段。Psyho的职业生涯成就与备战努力为胜利增添了传奇色彩,但人们清楚,这或许只是AI成长中的一个小插曲。
原文链接
近日,由谢赛宁领衔的华人团队推出全新编程竞赛基准LiveCodeBench Pro,测试中顶级大模型全军覆没,无一得分。该基准题库每日更新,涵盖IOI、Codeforces和ICPC竞赛题,防止模型刷题。测试显示,模型在知识密集型和逻辑密集型问题上有一定表现,但在观察密集型问题上表现欠佳。表现最佳的模型在中等难度题上的通过率仅为53%,难题通过率为0。即使工具调用被屏蔽,顶级模型的Elo评分仍低于人类大师级水平。团队成员多为奥林匹克竞赛获奖者,超半数为华人,且团队年轻化,成员来自顶尖学府。该项目旨在持续评估大模型算法逻辑深度,每个季度将发布全新评估集。
原文链接
加载更多

暂无内容