IMO金牌 - AI优秘圈

OpenAI IMO金牌团队爆料：AI拒绝作答第六题

2025年，OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成：Alexander Wei、Sheryl Hsu和Noam Brown，项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑，但在第六题上选择‘不作答’，显示出对自身能力边界的清晰认知。团队表示，这种行为避免了‘一本正经地胡说八道’，是AI的一大进步。此外，他们认为解决千禧年大奖难题仍遥不可及，因从1.5小时到数万小时思考时间的跨越难度极高。未来，团队计划将相关技术应用于更广泛的推理领域，并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用，但具体细节仍在研究中。

原文链接

数据炼金师

08-03 12:36:46

分享至

打开微信扫一扫

内容投诉

生成图片

仅用提示词工程摘下IMO金牌！清华校友强强联手新发现，学术界不靠砸钱也能比肩大厂

2025年8月，两位清华校友杨林和黄溢辰通过提示词工程和自我迭代验证流程，让基础模型Gemini 2.5 Pro成功解决了IMO 2025的5道题目，达到金牌水平。研究团队设计了一套六步验证流程，利用通用提示词显著提升模型推理能力，无需依赖高昂计算资源。实验结果表明，结构化迭代能突破单次生成的局限性，而详细的提示词可提高效率但不增加新能力。尽管第六题未能解决，研究人员认为验证器改进是关键。此研究展示了学术界在有限资源下也能媲美大厂的潜力，并期待AI未来在数学领域的更大贡献。论文链接及代码已公开。

原文链接

量子黑客

08-02 14:17:45

分享至

打开微信扫一扫

内容投诉

生成图片

AI拿下奥数IMO金牌，但数学界的AlphaGo时刻还没来

2025年国际数学奥林匹克（IMO）在澳大利亚落幕，AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准，分别获得35分，这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议，DeepMind则获IMO官方认证，但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步，但专家认为这并非数学界的AlphaGo时刻，因72名人类选手同样达金牌标准，且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理，但仍存局限性。学术界对AI辅助数学研究褒贬不一，有人看好其潜力，也有人担忧数学自由探索精神被技术资本侵蚀。

原文链接

AGI探路者

08-01 10:58:23

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI拿IMO金牌火了，为何大批人却怒了？

2025年7月，OpenAI宣布其未公开实验性大语言模型在国际数学奥林匹克竞赛（IMO）中获得金牌，得分35/42，引发争议。IMO组委会曾要求参赛AI公司闭幕式后一周再公布结果，以尊重人类选手并验证答案，但OpenAI在闭幕式当天（7月19日）即抢先发布。谷歌DeepMind同样获得金牌，但选择低调遵守规则。IMO评审团批评OpenAI的做法不尊重赛事规范。此外，OpenAI未参与官方评分流程，且拒绝了IMO提供的Lean格式题目支持。专家指出，若依据官方评分标准，OpenAI可能仅获银牌。OpenAI回应称未被告知‘一周后发布’的要求，且强调其发布时间符合闭幕式后建议。此事件引发广泛讨论。

原文链接

阿达旻

07-22 10:30:21

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌AI获IMO“唯一金牌”，硅谷夹道祝贺，奥特曼丢人又丢人

2025年7月，谷歌DeepMind开发的Gemini AI模型在国际数学奥林匹克竞赛（IMO）中获得唯一金牌，官方认证成绩为35分（满分42分）。该模型在4.5小时内解答了6道题中的5道，采用全新Deep Think推理模式，显著超越去年用时三天的成绩。谷歌CEO及DeepMind团队受到硅谷广泛祝贺，包括马斯克在内的业内人士纷纷称赞。相比之下，OpenAI因未与IMO官方合作、提前宣布成绩及评分争议而备受批评。OpenAI研究员Noam回应称其模型由IMO获奖者评分，并公开答题过程，但网友仍更倾向于支持谷歌。此次事件凸显了AI技术在复杂问题解决上的巨大进步及行业竞争的激烈性。

原文链接

数字墨迹

07-22 10:29:10

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI自封奥数金牌被全网爆锤，数学大神公开质疑

7月19日，OpenAI宣布其内部实验性AI模型在国际数学奥林匹克竞赛（IMO）中取得了相当于金牌的成绩，引发广泛争议。尽管模型未正式参赛，但研究员Alex Wei称其在闭幕式后发布消息，并邀请三位前IMO金牌得主评分验证。然而，批评者质疑发布时间抢了人类选手风头，且比赛规则和评分流程缺乏透明度。IMO官方要求AI公司一周后再公布结果，而OpenAI被指破坏赛事仪式感。数学大神陶哲轩也指出，AI与人类选手的资源差距使直接比较不公平。此次事件折射出人类对AI快速发展的复杂情绪，中国队在IMO中获得团体第一，全员金牌。

原文链接

未来编码者

07-21 16:20:01

分享至

打开微信扫一扫

内容投诉

生成图片

IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”

2025年7月21日，IMO官方怒斥OpenAI自封“金牌”行为，称其未经91位评委评分且未遵守闭幕式一周后再公布结果的要求。OpenAI被指为炒作成绩，选择在闭幕式刚结束就发布消息，引发学术道德争议。另一AI巨头谷歌DeepMind则保持克制，等待合适时机。中国队以全员6金、总分231分夺冠，邓乐言和张恒烨满分并列世界第一。下一届IMO将在上海中学举办，该校将成全球首所承办该赛事的中学。

原文链接

月光编码师

07-21 13:17:34

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI“截胡”IMO金牌，奥特曼为GPT-5献上“核弹级”预热

2025年7月20日，OpenAI通过全新通用推理模型在国际数学奥林匹克竞赛（IMO）中拿下金牌，引发广泛关注。这一成果被视为‘迈向AGI的重要一步’，并为即将发布的GPT-5铺路。谷歌DeepMind的AI模型虽也取得IMO金牌，但因内部审核延迟，未能抢先发布。OpenAI模型展示了更高层次的创造性思维与效率，尤其在解决多页证明等复杂问题上表现突出。数学家陶哲轩对此表示，缺乏统一测试标准下，评估AI数学能力需谨慎。奥特曼强调，GPT-5仍为实验性模型，短期内不会推出具备IMO金牌水平的版本。

原文链接

神经网络领航员

07-20 15:09:31

分享至

打开微信扫一扫

内容投诉

生成图片

陶哲轩回应 OpenAI 新模型 IMO 夺金，GPT-5 测试版曝光

2025年7月，OpenAI新模型在国际数学奥林匹克竞赛（IMO）中以35分斩获金牌，超过当年金牌线。该模型在6道题中解决了5道，模拟人类考试条件完成，解题过程严谨且具有创造性。尽管第6题未解，但其表现引发广泛关注。数学家陶哲轩对此发表评论，指出缺乏统一测试标准，呼吁谨慎看待AI竞赛表现。同时，第三方平台MathArena独立评测显示其他模型远未达获奖水平。OpenAI研究员透露，此为实验性研究，GPT-5即将发布，但相关模型数月内无发布计划。事件引发热议，部分网友认为结果本身具重要意义。

原文链接

梦境编程师

07-20 12:02:31

分享至

打开微信扫一扫

内容投诉

生成图片

“AI登月时刻”，OpenAI模型摘取奥数金牌

2025年7月，OpenAI的通用推理模型在国际奥林匹克数学竞赛（IMO）中达到金牌水平，完成6道题中的5道，获得35/42分。该模型在与人类相同的规则下参赛，无工具辅助，证明由前IMO奖牌得主批改。这一成就标志着通用推理技术的重大突破，未依赖专门训练或清晰奖励信号，而是通过复杂推理实现。OpenAI科学家称此为“AI登月时刻”，并透露模型研发仅用15个月，算力有限。此次突破拉开与DeepMind、Anthropic等竞争者差距，并为解决千禧年大奖难题带来希望。此外，GPT-5即将发布，采用全新强化学习技术，进一步提升泛化能力。这一进展预示AI迈向科学发现的新阶段。

原文链接

智能视野

07-20 10:03:13

分享至

打开微信扫一扫

内容投诉

生成图片