Seed Prover 1.5 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

正文：2025年12月，字节Seed AI团队发布数学推理模型Seed Prover 1.5，在IMO 2025竞赛中用16.5小时解决前5道题，获得35分金牌成绩，与谷歌Gemini持平。相比前代模型，新版本通过强化学习和计算资源扩展显著提升性能，并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具，前者通过多工具交互优化形式化证明效率，后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型，确保逻辑路径规划的准确性。测试表明，增加计算资源可对数线性提升解题率。

原文链接

未来笔触

12-25 14:40:05

Agentic Prover

Seed Prover 1.5

形式化证明

分享至

打开微信扫一扫

内容投诉

生成图片

字节推出形式化数学推理专用模型Seed Prover 1.5

12月24日，字节跳动Seed团队发布形式化数学推理专用模型Seed Prover 1.5。新模型在16.5小时内为IMO 2025前5道题目生成完整可编译验证的Lean证明代码，成绩达35/42，超过金牌分数线。技术报告已公开，并将开放API供数学与AI研究者体验。

原文链接

智能涌动

12-24 12:40:34

Seed Prover 1.5

字节跳动

形式化数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

12月24日，字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练，在IMO 2025前5道题目中取得35/42分，达到金牌分数线，并在9小时内完成Putnam 2025赛题中11道的Lean证明代码生成。评估显示，Seed Prover 1.5在Putnam历史评估集中解决88%问题，在硕士难度Fate-H和博士难度Fate-X评估集中分别解决80%和33%问题，刷新多项SOTA表现。技术报告已公开，后续将开放API链接。

原文链接