1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月30日,深度求索(DeepSeek)在Hugging Face上发布DeepSeek-Prover-V2-671B新模型。该模型专注于形式化数学推理,基于DeepSeek-V3-0324,采用递归定理证明管道生成初始数据。DeepSeek推出671B参数的DeepSeek-Prover-V2-671B和7B参数的DeepSeek-Prover-V2-7B两款模型,以及ProverBench数据集。团队通过分解复杂定理为子目标,并利用7B模型处理子目标证明,结合DeepSeek-V3的思维链生成强化学习数据。最终,671B版本在MiniF2F-test数据集上达到88.9%通过率,在PutnamBench数据集中解决问题49个。ProverBench数据集包含325个数学问题,覆盖高中竞赛及本科数学领域,推动AI数学推理能力的评估与应用。

原文链接
本文链接:https://kx.umi6.com/article/18060.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里通义千问推出Qwen3-Max-Thinking尝鲜版
2025-11-04 17:23:23
斯坦福打脸大模型数学水平:题干一改就集体降智,强如o1也失准
2025-01-06 10:19:08
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃成为“优等生”
2025-01-11 12:39:34
超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品
2025-04-01 11:18:45
TeleAI “复杂推理大模型” 达竞赛级数学表现,评分超 o1-preview
2025-01-26 17:15:51
梁文锋,与杨植麟再「撞车」
2025-05-12 15:36:02
菲尔兹奖得主亲测 GPT-4o,经典过河难题破解失败
2024-06-30 15:55:25
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型
2025-06-23 17:25:48
DeepSeek开源新模型,数学推理能力大提升
2025-05-01 09:16:24
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
2024-10-15 17:25:58
马斯克旗下xAI发布Grok 3聊天机器人 数学推理性能超GPT4o
2025-02-18 13:22:43
微软推出 14B 参数小语言模型 Phi-4:专攻数学等领域复杂推理
2024-12-13 13:24:50
24小时热文
更多
扫一扫体验小程序