DeepSeek-Prover-V2 登场：AI 数学推理新王者，88.9% 通过率设新标杆

2025-05-01 10:18:39

跨界思维

发布在

快讯

阅读：1231

4月30日，深度求索（DeepSeek）在Hugging Face上发布DeepSeek-Prover-V2-671B新模型。该模型专注于形式化数学推理，基于DeepSeek-V3-0324，采用递归定理证明管道生成初始数据。DeepSeek推出671B参数的DeepSeek-Prover-V2-671B和7B参数的DeepSeek-Prover-V2-7B两款模型，以及ProverBench数据集。团队通过分解复杂定理为子目标，并利用7B模型处理子目标证明，结合DeepSeek-V3的思维链生成强化学习数据。最终，671B版本在MiniF2F-test数据集上达到88.9%通过率，在PutnamBench数据集中解决问题49个。ProverBench数据集包含325个数学问题，覆盖高中竞赛及本科数学领域，推动AI数学推理能力的评估与应用。

原文链接

本文链接：https://kx.umi6.com/article/18060.html

转载请注明文章出处

DeepSeek-Prover-V2