形式化 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

AI Agent搞定世纪首次菲尔兹奖成果形式化！一周时间独立完成，20万行代码已公开

2026年3月，Math公司开发的AI Agent Gauss在一周内独立完成了菲尔兹奖级数学成果的形式化验证，涉及Maryna Viazovska在8维和24维最优球体堆积问题上的研究。这一成果原需6个月完成，现生成20万行Lean代码，成为历史上最大规模的单一目的形式化项目。Gauss还检测并修正了原论文中的细节错误，展示了AI加速数学研究的能力。团队认为，自动形式化将彻底变革数学知识体系。目前代码已公开发布。

原文链接

智能涌动

03-03 19:23:13

Gauss

形式化证明

菲尔兹奖

分享至

打开微信扫一扫

内容投诉

生成图片

OpenClaw们狂奔，谁来焊死安全车门？

OpenClaw们狂奔，谁来焊死安全车门？允中发自凹非寺量子位 | 公众号 QbitAI 2026年，AI从写诗画图的聊天机器人进化为“行动式智能体”，能接管操作系统、调用API、处理邮件和财务。然而，当AI拥有“手脚”时，恐慌也随之而来：误删核心数据或被诱导“黑化”怎么办？传统“打补丁...

原文链接

小阳哥

02-02 16:45:19

信任优先

形式化验证

智能体安全

分享至

打开微信扫一扫

内容投诉

生成图片

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

正文：2025年12月，字节Seed AI团队发布数学推理模型Seed Prover 1.5，在IMO 2025竞赛中用16.5小时解决前5道题，获得35分金牌成绩，与谷歌Gemini持平。相比前代模型，新版本通过强化学习和计算资源扩展显著提升性能，并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具，前者通过多工具交互优化形式化证明效率，后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型，确保逻辑路径规划的准确性。测试表明，增加计算资源可对数线性提升解题率。

原文链接

未来笔触

12-25 14:40:05

Agentic Prover

Seed Prover 1.5

形式化证明

分享至

打开微信扫一扫

内容投诉

生成图片

字节推出形式化数学推理专用模型Seed Prover 1.5

12月24日，字节跳动Seed团队发布形式化数学推理专用模型Seed Prover 1.5。新模型在16.5小时内为IMO 2025前5道题目生成完整可编译验证的Lean证明代码，成绩达35/42，超过金牌分数线。技术报告已公开，并将开放API供数学与AI研究者体验。

原文链接

智能涌动

12-24 12:40:34

Seed Prover 1.5

字节跳动

形式化数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

12月24日，字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练，在IMO 2025前5道题目中取得35/42分，达到金牌分数线，并在9小时内完成Putnam 2025赛题中11道的Lean证明代码生成。评估显示，Seed Prover 1.5在Putnam历史评估集中解决88%问题，在硕士难度Fate-H和博士难度Fate-X评估集中分别解决80%和33%问题，刷新多项SOTA表现。技术报告已公开，后续将开放API链接。

原文链接

幻彩逻辑RainbowLogic

12-24 12:36:08

Seed Prover 1.5

字节跳动

形式化数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

啥？陶哲轩18个月没搞定的数学挑战，被这个“AI高斯”三周完成了

2025年9月，一款名为Gauss的AI工具引发关注。它仅用三周时间完成了数学家陶哲轩和Alex Kontorovich耗时18个月尚未完全解决的挑战——在Lean中形式化强素数定理（PNT）。Gauss由AI公司Math开发，是首个可协助顶级数学家进行自动形式化的Agent，能将人类数学内容转换为机器可验证的形式语言。其生成了约25000行Lean代码，包含上千个定理，大幅缩短了传统需多年完成的工作。陶哲轩对此表示，AI工具虽然高效，但可能忽略项目中的隐含目标，因此项目组织者需更明确地阐述所有目标。Math公司创始人Christian Szegedy曾因提出Batch Normalization技术获ICML时间检验奖，推动了深度学习发展。网友对Gauss的技术细节充满期待，但官方尚未发布具体技术报告。

原文链接

AGI探路者

09-14 13:38:51

Gauss

形式化

陶哲轩

分享至

打开微信扫一扫

内容投诉

生成图片

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

标题：数学形式化准确率提升至84% | 字节&南大开源正文：人工智能在围棋、代码生成等领域已取得显著进展，但在理解并证明数学定理方面仍面临重大挑战。字节跳动Seed团队与南京大学联合发布CriticLean框架，将数学自然语言转化为Lean 4代码的形式化准确率从38%大幅提升至84...

原文链接

AI幻想空间站

07-31 09:01:37

CriticLean框架

Lean 4

数学形式化

分享至

打开微信扫一扫

内容投诉

生成图片

陶哲轩转发！DeepMind开源「AI数学证明标准习题集」

标题：陶哲轩转发！DeepMind开源「AI数学证明标准习题集」 DeepMind最新开源了形式化数学猜想库，这一资源集合了经典数学猜想的形式化表述，如解析数论中的朗道问题。此外，库中提供代码函数，便于将自然语言的数学猜想转化为形式化表述。陶哲轩曾利用Lean工具形式化证明PFR猜想，其第一步正是...

原文链接

星际Code流浪者

05-31 13:04:33

AI数学证明

DeepMind

形式化数学猜想

分享至

打开微信扫一扫

内容投诉

生成图片

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播

形式化证明与大模型：共创可验证的AI数学未来｜量子位直播 5月，多个重要进展引发关注：DeepSeek Prover V2发布、陶哲轩的AI数学直播以及谷歌推出的AlphaEvolve。大模型在解数学题方面的表现已成为衡量AI“智能天花板”的关键指标，吸引了众多团队投入研究。为更好评估AI的数...

原文链接

智能涌动

05-27 12:29:36

AI数学

大模型

形式化证明

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多