谷歌AI解决IMO中84%的几何问题,未做对一道。Nature报道:AI超越金牌得主平均水平。
谷歌DeepMind的数学AI解决了2000至2024年IMO竞赛中84%的几何问题。AlphaGeometry2论文发布,50道题中完成42道,比去年多15道。相比之下,纯语言模型OpenAI o1和Gemini Flash Thinking一道未解决。
例如,2024年竞赛中的第四题,AlphaGeometry2仅需19秒。该题要求证明两角之和为180°,AlphaGeometry2通过构造辅助线和相似三角形完成证明。
AlphaGeometry2的四大升级包括:扩展版的领域专用语言、升级版的符号推理引擎DDAR2、全新搜索算法SKEST和更强大的语言模型Gemini。这些改进使覆盖率从66%提升至88%,但仍无法解决3D几何、不等式和非线性方程等问题。
AlphaGeometry2的核心组件DDAR2经过优化,时间复杂度降低,实现速度提升。搜索算法SKEST则通过知识共享机制提高了效率。此外,Gemini语言模型通过多模态训练提升了能力,但视觉信息对解题影响不大。
2023年AIMO竞赛设立500万美元奖金,要求开源。尽管AlphaGeometry2具备金牌能力,但它并未开源。2025年IMO竞赛将于澳大利亚举行。
原文链接
本文链接:https://kx.umi6.com/article/12889.html
转载请注明文章出处
相关推荐
换一换
抓包现场:谷歌 AI 食谱被曝抄袭,“越红线”被批不再为原创导流
2025-12-02 10:07:02
TikTok“玩坏”谷歌AI
2024-12-17 08:57:37
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
2025-05-21 05:52:42
谷歌 AI 搜索引擎被指严重“幻觉”,错误称印度空难失事波音客机为“空中客车”机型
2025-06-13 11:06:41
破译水平接近专家!谷歌AI解读古籍核心错误率仅0.56%
2025-11-16 15:41:31
谷歌AI拿下IMO银牌,仅差一分得金!第四题仅用时19秒
2024-07-26 09:31:46
海外博主吐槽 AI 食谱泛滥:菜做出来没法吃,还抢了我们的饭碗
2025-11-30 12:06:58
首次击败人类数学天才,高中生最难数学考试被DeepMind AI攻克了
2025-02-10 16:13:49
谷歌 AI 误将“愚人节玩笑”当作真实新闻广泛传播,记者呼吁警惕假消息
2025-04-05 11:04:24
超越国际数学奥林匹克金牌得主:谷歌 DeepMind AI 系统展现超强几何解题能力
2025-02-08 08:17:00
谷歌AI开始抢用户!无需登录就能用了
2025-03-19 17:47:24
谷歌AI数学能力大提升 仅差1分即可摘得IMO金牌
2024-07-26 11:12:15
库里将利用谷歌AI提升运动表现
2025-08-21 14:39:56
659 文章
430352 浏览
24小时热文
更多
-
2026-01-23 17:11:08 -
2026-01-23 17:10:00 -
2026-01-23 17:08:55