正文:2025年12月,字节Seed AI团队发布数学推理模型Seed Prover 1.5,在IMO 2025竞赛中用16.5小时解决前5道题,获得35分金牌成绩,与谷歌Gemini持平。相比前代模型,新版本通过强化学习和计算资源扩展显著提升性能,并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具,前者通过多工具交互优化形式化证明效率,后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型,确保逻辑路径规划的准确性。测试表明,增加计算资源可对数线性提升解题率。
原文链接
本文链接:https://kx.umi6.com/article/30757.html
转载请注明文章出处
相关推荐
换一换
字节Seed发布最强数学模型:一招“打草稿”,IMO银牌变金牌
2025-12-25 14:40:05
字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
2025-12-24 12:36:08
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
2025-05-27 12:29:36
字节推出形式化数学推理专用模型Seed Prover 1.5
2025-12-24 12:40:34
2026年全国交通运输工作会议召开:加强关键核心技术攻关 深入实施“人工智能+交通运输”行动
2025-12-23 16:48:53
美多名作家起诉谷歌等6企业用版权书籍训练AI
2025-12-24 17:53:19
联想年度科幻概念片《双子星》官宣 2026 年 1 月 1 日上映
2025-12-25 11:30:57
交通运输部:加快培育发展智慧物流、低碳经济和交通数字产业 启动零碳公路运输通道建设
2025-12-24 11:33:33
液冷赛道进入爆发期 多家上市公司抢先布局
2025-12-25 08:24:15
OpenAI、Anthropic、xAI等6家人工智能巨头遭作家起诉版权侵权
2025-12-24 04:14:55
中信证券:大厂竞逐C端AI医疗Agent 医药电商有望率先受益
2025-12-25 09:26:45
LG 电子将在 CES 2026 首次展示家用机器人新品 LG CLOiD
2025-12-25 10:28:05
AI批量制造的「跳楼机」,快把音乐平台冲烂了
2025-12-24 12:32:47
600 文章
374241 浏览
24小时热文
更多
-
2025-12-25 15:44:34 -
2025-12-25 15:42:29 -
2025-12-25 15:41:35