谷歌AI解决IMO中84%的几何问题,未做对一道。Nature报道:AI超越金牌得主平均水平。
谷歌DeepMind的数学AI解决了2000至2024年IMO竞赛中84%的几何问题。AlphaGeometry2论文发布,50道题中完成42道,比去年多15道。相比之下,纯语言模型OpenAI o1和Gemini Flash Thinking一道未解决。
例如,2024年竞赛中的第四题,AlphaGeometry2仅需19秒。该题要求证明两角之和为180°,AlphaGeometry2通过构造辅助线和相似三角形完成证明。
AlphaGeometry2的四大升级包括:扩展版的领域专用语言、升级版的符号推理引擎DDAR2、全新搜索算法SKEST和更强大的语言模型Gemini。这些改进使覆盖率从66%提升至88%,但仍无法解决3D几何、不等式和非线性方程等问题。
AlphaGeometry2的核心组件DDAR2经过优化,时间复杂度降低,实现速度提升。搜索算法SKEST则通过知识共享机制提高了效率。此外,Gemini语言模型通过多模态训练提升了能力,但视觉信息对解题影响不大。
2023年AIMO竞赛设立500万美元奖金,要求开源。尽管AlphaGeometry2具备金牌能力,但它并未开源。2025年IMO竞赛将于澳大利亚举行。
原文链接
本文链接:https://kx.umi6.com/article/12889.html
转载请注明文章出处
相关推荐
换一换
Cyberklick&谷歌AI应用沙龙:洞察需求,长效增长
2024-08-21 17:04:58
谷歌 AI 又闯祸:错把游戏开发者个人电话当公司电话公布致其被骚扰
2024-10-17 07:55:13
吴永辉是谁?字节AGI计划一号位,谷歌AI扫地僧
2025-02-18 15:16:56
谷歌AI开始抢用户!无需登录就能用了
2025-03-19 17:47:24
首次击败人类数学天才,高中生最难数学考试被DeepMind AI攻克了
2025-02-10 16:13:49
谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下
2025-05-21 03:51:16
谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距
2025-04-24 08:28:04
超越国际数学奥林匹克金牌得主:谷歌 DeepMind AI 系统展现超强几何解题能力
2025-02-08 08:17:00
海外博主吐槽 AI 食谱泛滥:菜做出来没法吃,还抢了我们的饭碗
2025-11-30 12:06:58
破译水平接近专家!谷歌AI解读古籍核心错误率仅0.56%
2025-11-16 15:41:31
GPT-4o被谷歌新模型Gemini 1.5 Pro超越
2024-08-02 16:24:53
谷歌 AI 搜索引擎被指严重“幻觉”,错误称印度空难失事波音客机为“空中客车”机型
2025-06-13 11:06:41
谷歌AI数学能力大提升 仅差1分即可摘得IMO金牌
2024-07-26 11:12:15
754 文章
652090 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08