1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月24日,字节跳动Seed团队发布新一代形式化数学推理模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在IMO 2025前5道题目中取得35/42分,达到金牌分数线,并在9小时内完成Putnam 2025赛题中11道的Lean证明代码生成。评估显示,Seed Prover 1.5在Putnam历史评估集中解决88%问题,在硕士难度Fate-H和博士难度Fate-X评估集中分别解决80%和33%问题,刷新多项SOTA表现。技术报告已公开,后续将开放API链接。

原文链接
本文链接:https://kx.umi6.com/article/30700.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包内测字节跳动自研深度思考模型,并非接入 DeepSeek
2025-02-25 17:00:32
字节大模型团队全员会:朱文佳和吴永辉首度同台 聊了目标、开源和OKR
2025-03-18 19:52:04
张一鸣门徒的AI战争:不做通用大模型,专攻“大厂缝隙”
2025-08-01 15:06:59
字节跳动豆包小范围测试深度思考模型 接入的不是DeepSeek
2025-02-25 16:10:22
字节跳动发布端到端同声传译模型
2025-07-24 13:08:06
字节跳动豆包视频生成功能升级,提升语义理解、动作连贯性等方面表现
2025-04-30 19:26:45
字节视觉大模型负责人杨建朝今日内部官宣休息,周畅接任
2025-07-17 17:28:24
DeepSeek重构AI战局:字节跳动组织变阵 AGI战争硝烟四起
2025-02-21 14:57:55
字节跳动推出视频生成模型OmniHuman-1.5
2025-08-28 21:29:35
字节跳动登记即梦AI作品著作权
2025-04-07 10:53:53
字节跳动:AI开发工具TRAE月活已超百万
2025-06-12 14:38:12
知情人士:张一鸣很关注AI,往返北京是为和技术骨干交流
2025-06-20 15:03:21
字节发最新内部邮件:将禁用Cursor等第三方AI开发软件 推自研Trae作为替代
2025-05-28 17:28:02
24小时热文
更多
扫一扫体验小程序