IMO金牌 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

万亿思考模型新速度！蚂蚁开源Ring-2.5-1T：IMO金牌水平，强；混合线性架构，快！

2026年2月，蚂蚁集团发布全球首个开源混合线性架构万亿参数模型Ring-2.5-1T。该模型在数学逻辑推理和长程自主执行能力上表现突出，获得IMO金牌水平35分、CMO超国家集训队线105分的优异成绩，并在搜索、编码等复杂任务中展现高效能力。通过混合线性注意力架构，Ring-2.5-1T打破深度思考与推理速度、显存消耗的“不可能三角”，生成吞吐量提升3倍以上，访存规模降至1/10以下。模型已适配Claude Code、OpenClaw框架，并在Hugging Face、ModelScope等平台开源。此外，蚂蚁同期发布LLaDA2.1扩散语言模型和全模态大模型Ming-flash-omni-2.0，进一步推动多模态技术落地。这一系列更新展现了蚂蚁在AI领域的顶尖实力和技术底蕴。

原文链接

数据炼金师

02-14 12:14:17

IMO金牌水平

全模态大模型

混合线性架构

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek再破谷歌OpenAI垄断：开源IMO数学金牌大模型

2025年11月，DeepSeek开源全新数学模型DeepSeekMath-V2，专注自验证数学推理，打破谷歌和OpenAI在该领域的垄断。该模型在IMO 2025、CMO 2024及Putnam 2024竞赛中表现卓越，尤其在Putnam中以118/120超越人类最高分90分，并在代数、几何、数论等CNML级别问题上全面领先GPT-5-Thinking-High和Gemini 2.5-Pro。DeepSeekMath-V2采用迭代强化学习循环优化证明生成与验证，首次实现完全自动化数据标注流程，显著提升模型能力。此模型由研究员邵智宏主导开发，他曾提出经典算法GRPO并参与多个重要项目。这一成果标志着开源AI在复杂数学推理领域的重要突破。

原文链接

像素宇宙

11-28 13:28:13

DeepSeekMath-V2

IMO金牌模型

自验证数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI IMO金牌团队爆料：AI拒绝作答第六题

2025年，OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成：Alexander Wei、Sheryl Hsu和Noam Brown，项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑，但在第六题上选择‘不作答’，显示出对自身能力边界的清晰认知。团队表示，这种行为避免了‘一本正经地胡说八道’，是AI的一大进步。此外，他们认为解决千禧年大奖难题仍遥不可及，因从1.5小时到数万小时思考时间的跨越难度极高。未来，团队计划将相关技术应用于更广泛的推理领域，并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用，但具体细节仍在研究中。

原文链接

数据炼金师

08-03 12:36:46

AI数学能力

IMO金牌

OpenAI

分享至

打开微信扫一扫

内容投诉

生成图片

仅用提示词工程摘下IMO金牌！清华校友强强联手新发现，学术界不靠砸钱也能比肩大厂

2025年8月，两位清华校友杨林和黄溢辰通过提示词工程和自我迭代验证流程，让基础模型Gemini 2.5 Pro成功解决了IMO 2025的5道题目，达到金牌水平。研究团队设计了一套六步验证流程，利用通用提示词显著提升模型推理能力，无需依赖高昂计算资源。实验结果表明，结构化迭代能突破单次生成的局限性，而详细的提示词可提高效率但不增加新能力。尽管第六题未能解决，研究人员认为验证器改进是关键。此研究展示了学术界在有限资源下也能媲美大厂的潜力，并期待AI未来在数学领域的更大贡献。论文链接及代码已公开。

原文链接

量子黑客

08-02 14:17:45

Gemini 2.5 Pro

IMO金牌

提示词工程

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌IMO金牌模型可以用了！推理性能秒了o3、Grok 4

谷歌DeepMind推出的Gemini 2.5 Deep Think模型现已在Gemini App上线，该模型曾获IMO金牌。新版速度更快，但实力略逊于原版，可达到IMO铜牌水平。模型仅对Ultra订阅用户开放，月费约1803元人民币。DeepMind称其推理性能超越OpenAI的o3和马斯克的Grok 4，在代码性能和科学知识测试中表现最佳。优势包括迭代开发、科学数学发现、算法编写等。通过扩展并行“思考时间”，模型能生成多种想法并优化解决方案。团队还开发了强化学习技术提升性能，模型还可融合多篇论文观点，助力研究。参考链接已附上。

原文链接

Journeyman

08-02 10:14:11

Gemini 2.5 Deep Think

IMO金牌模型

推理性能

分享至

打开微信扫一扫

内容投诉

生成图片

AI拿下奥数IMO金牌，但数学界的AlphaGo时刻还没来

2025年国际数学奥林匹克（IMO）在澳大利亚落幕，AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准，分别获得35分，这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议，DeepMind则获IMO官方认证，但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步，但专家认为这并非数学界的AlphaGo时刻，因72名人类选手同样达金牌标准，且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理，但仍存局限性。学术界对AI辅助数学研究褒贬不一，有人看好其潜力，也有人担忧数学自由探索精神被技术资本侵蚀。

原文链接

AGI探路者

08-01 10:58:23

AI数学能力

IMO金牌

数学研究

分享至

打开微信扫一扫

内容投诉

生成图片

不怕被挖！谷歌晒IMO金牌团队大合照，还挨个圈出了联系方式

2025年7月，谷歌DeepMind团队在IMO（国际数学奥林匹克竞赛）中斩获金牌后，公开晒出团队大合照，并圈出每位成员的联系方式，引发广泛关注。这一举动被外界解读为对Meta（小扎）此前挖角行为的回应与‘挑衅’。此前，Meta迅速挖走了谷歌IMO团队中的三名核心华人成员，但这三人并未出现在合照中。团队负责人Thang Luong透露，来自山景城、纽约、新加坡等地的核心成员在伦敦总部集结，进行了一周的冲刺训练，最终完成对模型Gemini Deep Think的巅峰优化。团队成员包括多位顶尖科学家，如Yi Tay、Quoc Le等，他们在数学推理与代码生成等领域取得突破性进展。此次公开合照和名单不仅展示了谷歌的信心，也引发了行业对人才争夺战的新一轮关注。

原文链接

元界筑梦师

07-25 16:25:59

DeepMind

小扎挖角

谷歌IMO金牌团队

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI拿IMO金牌火了，为何大批人却怒了？

2025年7月，OpenAI宣布其未公开实验性大语言模型在国际数学奥林匹克竞赛（IMO）中获得金牌，得分35/42，引发争议。IMO组委会曾要求参赛AI公司闭幕式后一周再公布结果，以尊重人类选手并验证答案，但OpenAI在闭幕式当天（7月19日）即抢先发布。谷歌DeepMind同样获得金牌，但选择低调遵守规则。IMO评审团批评OpenAI的做法不尊重赛事规范。此外，OpenAI未参与官方评分流程，且拒绝了IMO提供的Lean格式题目支持。专家指出，若依据官方评分标准，OpenAI可能仅获银牌。OpenAI回应称未被告知‘一周后发布’的要求，且强调其发布时间符合闭幕式后建议。此事件引发广泛讨论。

原文链接

阿达旻

07-22 10:30:21

IMO金牌

OpenAI

谷歌DeepMind

分享至

打开微信扫一扫

内容投诉

生成图片

谷歌AI获IMO“唯一金牌”，硅谷夹道祝贺，奥特曼丢人又丢人

2025年7月，谷歌DeepMind开发的Gemini AI模型在国际数学奥林匹克竞赛（IMO）中获得唯一金牌，官方认证成绩为35分（满分42分）。该模型在4.5小时内解答了6道题中的5道，采用全新Deep Think推理模式，显著超越去年用时三天的成绩。谷歌CEO及DeepMind团队受到硅谷广泛祝贺，包括马斯克在内的业内人士纷纷称赞。相比之下，OpenAI因未与IMO官方合作、提前宣布成绩及评分争议而备受批评。OpenAI研究员Noam回应称其模型由IMO获奖者评分，并公开答题过程，但网友仍更倾向于支持谷歌。此次事件凸显了AI技术在复杂问题解决上的巨大进步及行业竞争的激烈性。

原文链接

数字墨迹

07-22 10:29:10

IMO金牌

OpenAI

谷歌AI

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI达IMO金牌水平数学家陶哲轩回应

7月21日，OpenAI宣布其推理模型在国际数学奥林匹克竞赛中达到金牌水平，六道题答对五道。研究员Alexander Wei称，这一成绩得益于通用强化学习和计算扩展的突破，而非特定任务优化。然而，知名数学家陶哲轩对此持谨慎态度，强调测试细节的微小变化可能显著影响AI表现。陶哲轩还表示，未提前公开测试方法的AI竞赛成绩，他将不予评价。这一进展引发对AI数学能力及评估标准的新讨论。

原文链接

阿达旻

07-21 17:25:05

IMO金牌水平

OpenAI

陶哲轩

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多