综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
正文:2025年12月,字节Seed AI团队发布数学推理模型Seed Prover 1.5,在IMO 2025竞赛中用16.5小时解决前5道题,获得35分金牌成绩,与谷歌Gemini持平。相比前代模型,新版本通过强化学习和计算资源扩展显著提升性能,并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具,前者通过多工具交互优化形式化证明效率,后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型,确保逻辑路径规划的准确性。测试表明,增加计算资源可对数线性提升解题率。
原文链接
12月24日,字节跳动Seed团队发布形式化数学推理专用模型Seed Prover 1.5。新模型在16.5小时内为IMO 2025前5道题目生成完整可编译验证的Lean证明代码,成绩达35/42,超过金牌分数线。技术报告已公开,并将开放API供数学与AI研究者体验。
原文链接
12月24日,字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在IMO 2025前5道题目中取得35/42分,达到金牌分数线,并在9小时内完成Putnam 2025赛题中11道的Lean证明代码生成。评估显示,Seed Prover 1.5在Putnam历史评估集中解决88%问题,在硕士难度Fate-H和博士难度Fate-X评估集中分别解决80%和33%问题,刷新多项SOTA表现。技术报告已公开,后续将开放API链接。
原文链接
加载更多
暂无内容