DeepSeek开源新模型,数学推理能力大提升
五一假期前,DeepSeek发布惊喜——DeepSeek-Prover-V2在Hugging Face上线,同步提供模型卡与示例代码。该版本包括两个模型:DeepSeek-Prover-V2-7B(基于V1.5,支持32K上下文输入)和DeepSeek-Prover-V2-671B(以DeepSeek-V3-Base为基础,性能最强)。
训练采用“递归+强化学习”策略:DeepSeek-V3分解复杂定理,生成子目标和推理思路,再利用GRPO算法优选最佳方案。模型具备“快速模式”(non-CoT)和“逻辑模式”(CoT),分别注重速度与过程透明。
开发分两阶段:初期专注快速模式,用“专家迭代”法优化;后期培养逻辑推理,迁移知识并引入“冷启动”机制。GRPO算法通过对比候选答案质量,引导模型选择最优解。
最终,671B模型的能力被“蒸馏”至7B模型,实现小体积高性能。7B模型在MiniF2F测试中达88.9%通过率,解出PutnamBench中的49题。同时发布的ProverBench数据集含325道题,覆盖多领域,展现模型在不同数学推理中的能力。
经典问题测试显示,模型不仅解答正确,还能清晰解释抽象概念。DeepSeek-Prover-V2不仅提供答案,还指引语言模型未来发展方向:从生成内容到生成结构化逻辑,这是通向通用人工智能的重要一步。
模型现已通过Hugging Face免费下载,支持Transformers接口部署。相关地址已在文末列出。
原文链接
本文链接:https://kx.umi6.com/article/18058.html
转载请注明文章出处
相关推荐
换一换
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
这么哇塞的世界模型,竟然是开源的!
2026-01-29 17:29:59
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
腾讯智能体开源大动作!关键技术都拿出来了,开发平台还全面升级
2025-09-22 12:58:11
阶跃星辰全面开源 Step 3.5 Flash:预训练+训练框架全放出 冲上 OpenClaw Top2
2026-03-04 10:34:06
群核科技发布空间大模型,或解决视频生成时空一致性难题
2025-08-26 14:47:34
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
阶跃星辰开源GUI Agent技术和4B GUI Agent模型
2025-12-01 15:15:24
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
649 文章
458722 浏览
24小时热文
更多
-
2026-03-10 11:10:02 -
2026-03-10 11:09:29 -
2026-03-10 11:08:54