
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年,OpenAI的IMO金牌团队揭示其背后仅由三名核心开发者组成:Alexander Wei、Sheryl Hsu和Noam Brown,项目在竞赛前两三个月突击完成。模型成功攻克IMO难题被视为AI数学能力的重要里程碑,但在第六题上选择‘不作答’,显示出对自身能力边界的清晰认知。团队表示,这种行为避免了‘一本正经地胡说八道’,是AI的一大进步。此外,他们认为解决千禧年大奖难题仍遥不可及,因从1.5小时到数万小时思考时间的跨越难度极高。未来,团队计划将相关技术应用于更广泛的推理领域,并探索让AI学会‘提出问题’的能力。模型或开放供数学家使用,但具体细节仍在研究中。
原文链接
2025年国际数学奥林匹克(IMO)在澳大利亚落幕,AI领域迎来重要突破。OpenAI和DeepMind先后宣布其模型达到IMO金牌标准,分别获得35分,这是AI首次比肩顶尖高中生选手。OpenAI提前公布成绩引发争议,DeepMind则获IMO官方认证,但其金牌团队三名核心研究员已被Meta挖角。尽管AI取得显著进步,但专家认为这并非数学界的AlphaGo时刻,因72名人类选手同样达金牌标准,且AI仅解出5道题。此次突破证明语言模型可直接完成高难度数学推理,但仍存局限性。学术界对AI辅助数学研究褒贬不一,有人看好其潜力,也有人担忧数学自由探索精神被技术资本侵蚀。
原文链接
清华AI数学家:独立完成理论难题,自动调用基本定理构建证明思路
近日,清华大学团队推出了一款名为AIM(AI Mathematician)的数学推理框架,旨在解决前沿数学理论问题。这项技术通过自动化推理,能够独立完成复杂理论的证明工作,并展现出较高的完成度。
例如,在解决吸收边界条件问题时,AI...
原文链接
标题:陶哲轩转发!DeepMind开源「AI数学证明标准习题集」
DeepMind最新开源了形式化数学猜想库,这一资源集合了经典数学猜想的形式化表述,如解析数论中的朗道问题。此外,库中提供代码函数,便于将自然语言的数学猜想转化为形式化表述。
陶哲轩曾利用Lean工具形式化证明PFR猜想,其第一步正是...
原文链接
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
5月,多个重要进展引发关注:DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标,吸引了众多团队投入研究。
为更好评估AI的数...
原文链接
4月25日,英伟达发布两款专注于数学推理的AI模型——OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle。这两款基于Qwen系列transformer架构的模型,通过在OpenMathReasoning数据集上的深度微调,显著提升了复杂数学问题的解决...
原文链接
在AI数学领域,头部产品如Mathway和PhotoMath占据主导地位,合计占据了总MAU的88%,总收入的80%,总下载量的64%。这一赛道显示出明显的垄断趋势,新进入者面临挑战,需寻找差异化服务或核心优势。在过去的一年中,AI数学产品的下载、营收和MAU数据揭示了市场的动态变化。
下载、营收...
原文链接
国际数学奥林匹克(IMO)比赛中,陶哲轩教授亲自为AI团队Numina颁奖,他们在AI数学奥林匹克(AIMO)竞赛中展示了出色的表现。Numina团队的7B模型成功解决了29道未公开的难题,获得首个进步奖。不同于常规,比赛限制了算力、模型和时间,强调创新而非资源投入。团队开源了模型、数据和训练过程,模型能通过Python验证解题思路。非营利组织Numina的目标是推动AI4Math的开放研究,他们希望创建AI数学的ImageNet,以促进数学问题解决的模型发展。团队背后的故事和取得的成就,预示着AI在数学领域的新篇章。
原文链接
加载更多

暂无内容