形式化证明 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI Agent搞定世纪首次菲尔兹奖成果形式化！一周时间独立完成，20万行代码已公开

2026年3月，Math公司开发的AI Agent Gauss在一周内独立完成了菲尔兹奖级数学成果的形式化验证，涉及Maryna Viazovska在8维和24维最优球体堆积问题上的研究。这一成果原需6个月完成，现生成20万行Lean代码，成为历史上最大规模的单一目的形式化项目。Gauss还检测并修正了原论文中的细节错误，展示了AI加速数学研究的能力。团队认为，自动形式化将彻底变革数学知识体系。目前代码已公开发布。

原文链接

智能涌动

03-03 19:23:13

Gauss

形式化证明

菲尔兹奖

分享至

打开微信扫一扫

内容投诉

生成图片

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

正文：2025年12月，字节Seed AI团队发布数学推理模型Seed Prover 1.5，在IMO 2025竞赛中用16.5小时解决前5道题，获得35分金牌成绩，与谷歌Gemini持平。相比前代模型，新版本通过强化学习和计算资源扩展显著提升性能，并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具，前者通过多工具交互优化形式化证明效率，后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型，确保逻辑路径规划的准确性。测试表明，增加计算资源可对数线性提升解题率。

原文链接

未来笔触

12-25 14:40:05

Agentic Prover

Seed Prover 1.5

形式化证明

分享至

打开微信扫一扫

内容投诉

生成图片

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播 5月，多个重要进展引发关注：DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标，吸引了众多团队投入研究。为更好评估AI的数...

原文链接

智能涌动

05-27 12:29:36

AI数学

大模型

形式化证明

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多