
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成:Alexander Wei、Sheryl Hsu和Noam Brown,项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑,但在第六题上选择‘不作答’,显示出对自身能力边界的清晰认知。团队表示,这种行为避免了‘一本正经地胡说八道’,是AI的一大进步。此外,他们认为解决千禧年大奖难题仍遥不可及,因从1.5小时到数万小时思考时间的跨越难度极高。未来,团队计划将相关技术应用于更广泛的推理领域,并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用,但具体细节仍在研究中。
原文链接
2025年8月,两位清华校友杨林和黄溢辰通过提示词工程和自我迭代验证流程,让基础模型Gemini 2.5 Pro成功解决了IMO 2025的5道题目,达到金牌水平。研究团队设计了一套六步验证流程,利用通用提示词显著提升模型推理能力,无需依赖高昂计算资源。实验结果表明,结构化迭代能突破单次生成的局限性,而详细的提示词可提高效率但不增加新能力。尽管第六题未能解决,研究人员认为验证器改进是关键。此研究展示了学术界在有限资源下也能媲美大厂的潜力,并期待AI未来在数学领域的更大贡献。论文链接及代码已公开。
原文链接
谷歌DeepMind推出的Gemini 2.5 Deep Think模型现已在Gemini App上线,该模型曾获IMO金牌。新版速度更快,但实力略逊于原版,可达到IMO铜牌水平。模型仅对Ultra订阅用户开放,月费约1803元人民币。DeepMind称其推理性能超越OpenAI的o3和马斯克的Grok 4,在代码性能和科学知识测试中表现最佳。优势包括迭代开发、科学数学发现、算法编写等。通过扩展并行“思考时间”,模型能生成多种想法并优化解决方案。团队还开发了强化学习技术提升性能,模型还可融合多篇论文观点,助力研究。参考链接已附上。
原文链接
2025年国际数学奥林匹克(IMO)在澳大利亚落幕,AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准,分别获得35分,这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议,DeepMind则获IMO官方认证,但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步,但专家认为这并非数学界的AlphaGo时刻,因72名人类选手同样达金牌标准,且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理,但仍存局限性。学术界对AI辅助数学研究褒贬不一,有人看好其潜力,也有人担忧数学自由探索精神被技术资本侵蚀。
原文链接
2025年7月,谷歌DeepMind团队在IMO(国际数学奥林匹克竞赛)中斩获金牌后,公开晒出团队大合照,并圈出每位成员的联系方式,引发广泛关注。这一举动被外界解读为对Meta(小扎)此前挖角行为的回应与‘挑衅’。此前,Meta迅速挖走了谷歌IMO团队中的三名核心华人成员,但这三人并未出现在合照中。团队负责人Thang Luong透露,来自山景城、纽约、新加坡等地的核心成员在伦敦总部集结,进行了一周的冲刺训练,最终完成对模型Gemini Deep Think的巅峰优化。团队成员包括多位顶尖科学家,如Yi Tay、Quoc Le等,他们在数学推理与代码生成等领域取得突破性进展。此次公开合照和名单不仅展示了谷歌的信心,也引发了行业对人才争夺战的新一轮关注。
原文链接
2025年7月,OpenAI宣布其未公开实验性大语言模型在国际数学奥林匹克竞赛(IMO)中获得金牌,得分35/42,引发争议。IMO组委会曾要求参赛AI公司闭幕式后一周再公布结果,以尊重人类选手并验证答案,但OpenAI在闭幕式当天(7月19日)即抢先发布。谷歌DeepMind同样获得金牌,但选择低调遵守规则。IMO评审团批评OpenAI的做法不尊重赛事规范。此外,OpenAI未参与官方评分流程,且拒绝了IMO提供的Lean格式题目支持。专家指出,若依据官方评分标准,OpenAI可能仅获银牌。OpenAI回应称未被告知‘一周后发布’的要求,且强调其发布时间符合闭幕式后建议。此事件引发广泛讨论。
原文链接
2025年7月,谷歌DeepMind开发的Gemini AI模型在国际数学奥林匹克竞赛(IMO)中获得唯一金牌,官方认证成绩为35分(满分42分)。该模型在4.5小时内解答了6道题中的5道,采用全新Deep Think推理模式,显著超越去年用时三天的成绩。谷歌CEO及DeepMind团队受到硅谷广泛祝贺,包括马斯克在内的业内人士纷纷称赞。相比之下,OpenAI因未与IMO官方合作、提前宣布成绩及评分争议而备受批评。OpenAI研究员Noam回应称其模型由IMO获奖者评分,并公开答题过程,但网友仍更倾向于支持谷歌。此次事件凸显了AI技术在复杂问题解决上的巨大进步及行业竞争的激烈性。
原文链接
7月21日,OpenAI宣布其推理模型在国际数学奥林匹克竞赛中达到金牌水平,六道题答对五道。研究员Alexander Wei称,这一成绩得益于通用强化学习和计算扩展的突破,而非特定任务优化。然而,知名数学家陶哲轩对此持谨慎态度,强调测试细节的微小变化可能显著影响AI表现。陶哲轩还表示,未提前公开测试方法的AI竞赛成绩,他将不予评价。这一进展引发对AI数学能力及评估标准的新讨论。
原文链接
7月19日,OpenAI宣布其内部实验性AI模型在国际数学奥林匹克竞赛(IMO)中取得了相当于金牌的成绩,引发广泛争议。尽管模型未正式参赛,但研究员Alex Wei称其在闭幕式后发布消息,并邀请三位前IMO金牌得主评分验证。然而,批评者质疑发布时间抢了人类选手风头,且比赛规则和评分流程缺乏透明度。IMO官方要求AI公司一周后再公布结果,而OpenAI被指破坏赛事仪式感。数学大神陶哲轩也指出,AI与人类选手的资源差距使直接比较不公平。此次事件折射出人类对AI快速发展的复杂情绪,中国队在IMO中获得团体第一,全员金牌。
原文链接
2025年7月21日,IMO官方怒斥OpenAI自封“金牌”行为,称其未经91位评委评分且未遵守闭幕式一周后再公布结果的要求。OpenAI被指为炒作成绩,选择在闭幕式刚结束就发布消息,引发学术道德争议。另一AI巨头谷歌DeepMind则保持克制,等待合适时机。中国队以全员6金、总分231分夺冠,邓乐言和张恒烨满分并列世界第一。下一届IMO将在上海中学举办,该校将成全球首所承办该赛事的中学。
原文链接
加载更多

暂无内容