综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成:Alexander Wei、Sheryl Hsu和Noam Brown,项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑,但在第六题上选择‘不作答’,显示出对自身能力边界的清晰认知。团队表示,这种行为避免了‘一本正经地胡说八道’,是AI的一大进步。此外,他们认为解决千禧年大奖难题仍遥不可及,因从1.5小时到数万小时思考时间的跨越难度极高。未来,团队计划将相关技术应用于更广泛的推理领域,并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用,但具体细节仍在研究中。
原文链接
2025年8月,两位清华校友杨林和黄溢辰通过提示词工程和自我迭代验证流程,让基础模型Gemini 2.5 Pro成功解决了IMO 2025的5道题目,达到金牌水平。研究团队设计了一套六步验证流程,利用通用提示词显著提升模型推理能力,无需依赖高昂计算资源。实验结果表明,结构化迭代能突破单次生成的局限性,而详细的提示词可提高效率但不增加新能力。尽管第六题未能解决,研究人员认为验证器改进是关键。此研究展示了学术界在有限资源下也能媲美大厂的潜力,并期待AI未来在数学领域的更大贡献。论文链接及代码已公开。
原文链接
2025年国际数学奥林匹克(IMO)在澳大利亚落幕,AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准,分别获得35分,这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议,DeepMind则获IMO官方认证,但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步,但专家认为这并非数学界的AlphaGo时刻,因72名人类选手同样达金牌标准,且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理,但仍存局限性。学术界对AI辅助数学研究褒贬不一,有人看好其潜力,也有人担忧数学自由探索精神被技术资本侵蚀。
原文链接
2025年7月,OpenAI宣布其未公开实验性大语言模型在国际数学奥林匹克竞赛(IMO)中获得金牌,得分35/42,引发争议。IMO组委会曾要求参赛AI公司闭幕式后一周再公布结果,以尊重人类选手并验证答案,但OpenAI在闭幕式当天(7月19日)即抢先发布。谷歌DeepMind同样获得金牌,但选择低调遵守规则。IMO评审团批评OpenAI的做法不尊重赛事规范。此外,OpenAI未参与官方评分流程,且拒绝了IMO提供的Lean格式题目支持。专家指出,若依据官方评分标准,OpenAI可能仅获银牌。OpenAI回应称未被告知‘一周后发布’的要求,且强调其发布时间符合闭幕式后建议。此事件引发广泛讨论。
原文链接
2025年7月,谷歌DeepMind开发的Gemini AI模型在国际数学奥林匹克竞赛(IMO)中获得唯一金牌,官方认证成绩为35分(满分42分)。该模型在4.5小时内解答了6道题中的5道,采用全新Deep Think推理模式,显著超越去年用时三天的成绩。谷歌CEO及DeepMind团队受到硅谷广泛祝贺,包括马斯克在内的业内人士纷纷称赞。相比之下,OpenAI因未与IMO官方合作、提前宣布成绩及评分争议而备受批评。OpenAI研究员Noam回应称其模型由IMO获奖者评分,并公开答题过程,但网友仍更倾向于支持谷歌。此次事件凸显了AI技术在复杂问题解决上的巨大进步及行业竞争的激烈性。
原文链接
7月19日,OpenAI宣布其内部实验性AI模型在国际数学奥林匹克竞赛(IMO)中取得了相当于金牌的成绩,引发广泛争议。尽管模型未正式参赛,但研究员Alex Wei称其在闭幕式后发布消息,并邀请三位前IMO金牌得主评分验证。然而,批评者质疑发布时间抢了人类选手风头,且比赛规则和评分流程缺乏透明度。IMO官方要求AI公司一周后再公布结果,而OpenAI被指破坏赛事仪式感。数学大神陶哲轩也指出,AI与人类选手的资源差距使直接比较不公平。此次事件折射出人类对AI快速发展的复杂情绪,中国队在IMO中获得团体第一,全员金牌。
原文链接
2025年7月21日,IMO官方怒斥OpenAI自封“金牌”行为,称其未经91位评委评分且未遵守闭幕式一周后再公布结果的要求。OpenAI被指为炒作成绩,选择在闭幕式刚结束就发布消息,引发学术道德争议。另一AI巨头谷歌DeepMind则保持克制,等待合适时机。中国队以全员6金、总分231分夺冠,邓乐言和张恒烨满分并列世界第一。下一届IMO将在上海中学举办,该校将成全球首所承办该赛事的中学。
原文链接
2025年7月20日,OpenAI通过全新通用推理模型在国际数学奥林匹克竞赛(IMO)中拿下金牌,引发广泛关注。这一成果被视为‘迈向AGI的重要一步’,并为即将发布的GPT-5铺路。谷歌DeepMind的AI模型虽也取得IMO金牌,但因内部审核延迟,未能抢先发布。OpenAI模型展示了更高层次的创造性思维与效率,尤其在解决多页证明等复杂问题上表现突出。数学家陶哲轩对此表示,缺乏统一测试标准下,评估AI数学能力需谨慎。奥特曼强调,GPT-5仍为实验性模型,短期内不会推出具备IMO金牌水平的版本。
原文链接
2025年7月,OpenAI新模型在国际数学奥林匹克竞赛(IMO)中以35分斩获金牌,超过当年金牌线。该模型在6道题中解决了5道,模拟人类考试条件完成,解题过程严谨且具有创造性。尽管第6题未解,但其表现引发广泛关注。数学家陶哲轩对此发表评论,指出缺乏统一测试标准,呼吁谨慎看待AI竞赛表现。同时,第三方平台MathArena独立评测显示其他模型远未达获奖水平。OpenAI研究员透露,此为实验性研究,GPT-5即将发布,但相关模型数月内无发布计划。事件引发热议,部分网友认为结果本身具重要意义。
原文链接
2025年7月,OpenAI的通用推理模型在国际奥林匹克数学竞赛(IMO)中达到金牌水平,完成6道题中的5道,获得35/42分。该模型在与人类相同的规则下参赛,无工具辅助,证明由前IMO奖牌得主批改。这一成就标志着通用推理技术的重大突破,未依赖专门训练或清晰奖励信号,而是通过复杂推理实现。OpenAI科学家称此为“AI登月时刻”,并透露模型研发仅用15个月,算力有限。此次突破拉开与DeepMind、Anthropic等竞争者差距,并为解决千禧年大奖难题带来希望。此外,GPT-5即将发布,采用全新强化学习技术,进一步提升泛化能力。这一进展预示AI迈向科学发现的新阶段。
原文链接
加载更多
暂无内容