DeepSeek开源新模型,数学推理能力大提升
五一假期前,DeepSeek发布惊喜——DeepSeek-Prover-V2在Hugging Face上线,同步提供模型卡与示例代码。该版本包括两个模型:DeepSeek-Prover-V2-7B(基于V1.5,支持32K上下文输入)和DeepSeek-Prover-V2-671B(以DeepSeek-V3-Base为基础,性能最强)。
训练采用“递归+强化学习”策略:DeepSeek-V3分解复杂定理,生成子目标和推理思路,再利用GRPO算法优选最佳方案。模型具备“快速模式”(non-CoT)和“逻辑模式”(CoT),分别注重速度与过程透明。
开发分两阶段:初期专注快速模式,用“专家迭代”法优化;后期培养逻辑推理,迁移知识并引入“冷启动”机制。GRPO算法通过对比候选答案质量,引导模型选择最优解。
最终,671B模型的能力被“蒸馏”至7B模型,实现小体积高性能。7B模型在MiniF2F测试中达88.9%通过率,解出PutnamBench中的49题。同时发布的ProverBench数据集含325道题,覆盖多领域,展现模型在不同数学推理中的能力。
经典问题测试显示,模型不仅解答正确,还能清晰解释抽象概念。DeepSeek-Prover-V2不仅提供答案,还指引语言模型未来发展方向:从生成内容到生成结构化逻辑,这是通向通用人工智能的重要一步。
模型现已通过Hugging Face免费下载,支持Transformers接口部署。相关地址已在文末列出。
原文链接
本文链接:https://kx.umi6.com/article/18058.html
转载请注明文章出处
相关推荐
换一换
智谱上线并开源文本转语音模型 GLM-TTS:只需 3 秒语音样本即可克隆声音
2025-12-11 10:42:18
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
腾讯混元开源全新翻译模型Hy-MT2 ,上线小程序「腾讯Hy翻译」
2026-05-21 18:54:02
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
荣耀推出智能体基础模型MagicAgent 面向全球开源
2026-03-03 16:20:21
小米的首代机器人VLA大模型来了!丝滑赛德芙,推理延迟仅80ms丨全面开源
2026-02-12 21:45:01
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
707 文章
628722 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41