1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:2025年12月,字节Seed AI团队发布数学推理模型Seed Prover 1.5,在IMO 2025竞赛中用16.5小时解决前5道题,获得35分金牌成绩,与谷歌Gemini持平。相比前代模型,新版本通过强化学习和计算资源扩展显著提升性能,并在Putnam竞赛基准中刷新SOTA成绩。技术亮点包括Agentic Prover架构和Sketch Model工具,前者通过多工具交互优化形式化证明效率,后者模拟人类“打草稿”方式分解复杂问题。研究团队采用混合奖励信号训练模型,确保逻辑路径规划的准确性。测试表明,增加计算资源可对数线性提升解题率。

原文链接
本文链接:https://kx.umi6.com/article/30757.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节推出形式化数学推理专用模型Seed Prover 1.5
2025-12-24 12:40:34
AI Agent搞定世纪首次菲尔兹奖成果形式化!一周时间独立完成,20万行代码已公开
2026-03-03 19:23:13
字节Seed发布最强数学模型:一招“打草稿”,IMO银牌变金牌
2025-12-25 14:40:05
字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5
2025-12-24 12:36:08
形式化证明与大模型:共创可验证的AI数学未来|量子位直播
2025-05-27 12:29:36
13 vs 3,国产安全AI悄悄完成了对Claude的超越
2026-03-02 13:28:42
海淀放大招!90亿资金+近30条政策,重磅释放三大科创关键信号
2026-02-28 21:50:30
国家数据局局长刘烈宏:加快建设一批数据领域重点实验室等创新平台 大力推进数据领域关键技术、设备攻关与应用创新
2026-03-03 09:49:12
大模型越聪明,学习机越抢手:科大讯飞T90 Pro定义「真」个性化
2026-03-03 19:28:11
英伟达放弃GPU上LPU:新推理芯片被曝Groq即买即用,OpenAI第一个吃螃蟹
2026-03-03 15:06:12
荣耀机器人手机亮相 CEO李健称将赋予手机“大脑”和“手脚”
2026-03-01 22:30:41
Notion引入MiniMax M2.5,作为Custom Agents唯一可用的全球开源模型
2026-03-02 17:45:05
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
2026-03-03 11:54:49
24小时热文
更多
扫一扫体验小程序