1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

DeepSeek开源新模型,数学推理能力大提升

五一假期前,DeepSeek发布惊喜——DeepSeek-Prover-V2在Hugging Face上线,同步提供模型卡与示例代码。该版本包括两个模型:DeepSeek-Prover-V2-7B(基于V1.5,支持32K上下文输入)和DeepSeek-Prover-V2-671B(以DeepSeek-V3-Base为基础,性能最强)。

训练采用“递归+强化学习”策略:DeepSeek-V3分解复杂定理,生成子目标和推理思路,再利用GRPO算法优选最佳方案。模型具备“快速模式”(non-CoT)和“逻辑模式”(CoT),分别注重速度与过程透明。

开发分两阶段:初期专注快速模式,用“专家迭代”法优化;后期培养逻辑推理,迁移知识并引入“冷启动”机制。GRPO算法通过对比候选答案质量,引导模型选择最优解。

最终,671B模型的能力被“蒸馏”至7B模型,实现小体积高性能。7B模型在MiniF2F测试中达88.9%通过率,解出PutnamBench中的49题。同时发布的ProverBench数据集含325道题,覆盖多领域,展现模型在不同数学推理中的能力。

经典问题测试显示,模型不仅解答正确,还能清晰解释抽象概念。DeepSeek-Prover-V2不仅提供答案,还指引语言模型未来发展方向:从生成内容到生成结构化逻辑,这是通向通用人工智能的重要一步。

模型现已通过Hugging Face免费下载,支持Transformers接口部署。相关地址已在文末列出。

原文链接
本文链接:https://kx.umi6.com/article/18058.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
1.5B参数撬动“吉卜力级”全能体验,国产开源之光多模态统一模型,来了
2025-07-30 12:43:45
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
用编程大模型登顶开源第一后,智谱GLM团队被拷问了3小时
2025-12-25 11:29:48
中国移动“九天”通用基础大模型 3.0 发布,核心技术开源
2025-07-26 22:47:54
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
智谱GLM-4.7-Flash正式发布并开源
2026-01-20 08:45:53
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
李开复:如果十年后回顾 DeepSeek 如何让中国未落后美国,答案是开源
2025-09-27 12:40:23
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
2025-12-15 16:49:04
24小时热文
更多
扫一扫体验小程序