12月24日,字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在IMO 2025前5道题目中取得35/42分,达到金牌分数线,并在9小时内完成Putnam 2025赛题中11道的Lean证明代码生成。评估显示,Seed Prover 1.5在Putnam历史评估集中解决88%问题,在硕士难度Fate-H和博士难度Fate-X评估集中分别解决80%和33%问题,刷新多项SOTA表现。技术报告已公开,后续将开放API链接。
原文链接
本文链接:https://kx.umi6.com/article/30700.html
转载请注明文章出处
相关推荐
换一换
字节Seed发布最强数学模型:一招“打草稿”,IMO银牌变金牌
2025-12-25 14:40:05
字节跳动正在研发人工智能芯片 并与三星就芯片制造事宜进行谈判
2026-02-11 13:22:46
字节跳动最新思考模型将于4月17日供用户体验 单位推理成本相比DeepSeek R1降低50%
2025-04-14 12:33:19
字节跳动即梦图片 4.0 发布:首次支持多模态生图,大白话就能编辑
2025-09-08 09:55:00
字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型
2025-04-17 11:33:28
字节跳动发布通用机器人模型GR-3
2025-07-22 12:32:35
字节跳动发布 Seedance 1.5 pro 模型,支持音视频联合生成
2025-12-16 21:00:49
字节藏了一手牌
2025-07-12 18:53:26
投资界24h |字节跳动,新王炸诞生了;海光信息、中科曙光终止重大资产重组;嘉御资本募资,超40亿
2025-12-10 09:33:07
字节Seed发布GR-RL 首次实现真机强化学习穿鞋带
2025-12-02 14:21:13
又一位字节AI大将离职
2025-03-13 14:20:01
字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
2025-12-24 12:36:08
解锁任意模态 AI 模型训练,字节跳动 Seed 开源 VeOmni 框架
2025-08-14 18:01:26
674 文章
476272 浏览
24小时热文
更多
-
2026-03-04 00:49:02 -
2026-03-04 00:47:53 -
2026-03-03 23:45:39