综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2026年3月,Math公司开发的AI Agent Gauss在一周内独立完成了菲尔兹奖级数学成果的形式化验证,涉及Maryna Viazovska在8维和24维最优球体堆积问题上的研究。这一成果原需6个月完成,现生成20万行Lean代码,成为历史上最大规模的单一目的形式化项目。Gauss还检测并修正了原论文中的细节错误,展示了AI加速数学研究的能力。团队认为,自动形式化将彻底变革数学知识体系。目前代码已公开发布。
原文链接
正文:2025年12月,字节Seed AI团队发布数学推理模型Seed Prover 1.5,在IMO 2025竞赛中用16.5小时解决前5道题,获得35分金牌成绩,与谷歌Gemini持平。相比前代模型,新版本通过强化学习和计算资源扩展显著提升性能,并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具,前者通过多工具交互优化形式化证明效率,后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型,确保逻辑路径规划的准确性。测试表明,增加计算资源可对数线性提升解题率。
原文链接
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
5月,多个重要进展引发关注:DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标,吸引了众多团队投入研究。
为更好评估AI的数...
原文链接
加载更多
暂无内容