DeepSeek开源新模型,数学推理能力大提升
五一假期前,DeepSeek发布惊喜——DeepSeek-Prover-V2在Hugging Face上线,同步提供模型卡与示例代码。该版本包括两个模型:DeepSeek-Prover-V2-7B(基于V1.5,支持32K上下文输入)和DeepSeek-Prover-V2-671B(以DeepSeek-V3-Base为基础,性能最强)。
训练采用“递归+强化学习”策略:DeepSeek-V3分解复杂定理,生成子目标和推理思路,再利用GRPO算法优选最佳方案。模型具备“快速模式”(non-CoT)和“逻辑模式”(CoT),分别注重速度与过程透明。
开发分两阶段:初期专注快速模式,用“专家迭代”法优化;后期培养逻辑推理,迁移知识并引入“冷启动”机制。GRPO算法通过对比候选答案质量,引导模型选择最优解。
最终,671B模型的能力被“蒸馏”至7B模型,实现小体积高性能。7B模型在MiniF2F测试中达88.9%通过率,解出PutnamBench中的49题。同时发布的ProverBench数据集含325道题,覆盖多领域,展现模型在不同数学推理中的能力。
经典问题测试显示,模型不仅解答正确,还能清晰解释抽象概念。DeepSeek-Prover-V2不仅提供答案,还指引语言模型未来发展方向:从生成内容到生成结构化逻辑,这是通向通用人工智能的重要一步。
模型现已通过Hugging Face免费下载,支持Transformers接口部署。相关地址已在文末列出。
原文链接
本文链接:https://kx.umi6.com/article/18058.html
转载请注明文章出处
相关推荐
.png)
换一换
微软将开源 GitHub Copilot Chat 扩展,推动 VS Code 成开源 AI 编辑器
2025-05-20 15:43:49
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
直观即时绘制3D模型,可添加文本提示,VAST又开源了
2025-04-21 19:49:57
小米首个推理大模型开源
2025-04-30 20:36:34
中国AI 大厂,被Deepseek 掀了牌桌之后
2025-05-19 13:16:00
大模型刷数学题竟有害?CMU评估20+模型指出训练陷阱
2025-07-08 17:52:09
阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发
2025-06-12 16:39:43
字节跳动开源 Deep Research 项目 DeerFlow:可生成图文报告、语音播客
2025-05-10 21:11:54
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
2025-05-09 12:47:33
Coze/Dify/FastGPT/N8N :该如何选择Agent平台?
2025-06-09 10:25:58
当FPGA遇上开源,要变天了
2025-04-27 15:25:40
463 文章
160046 浏览
24小时热文
更多

-
2025-09-06 16:37:17
-
2025-09-06 16:36:53
-
2025-09-06 16:36:08