2025年11月,DeepSeek开源全新数学模型DeepSeekMath-V2,专注自验证数学推理,打破谷歌和OpenAI在该领域的垄断。该模型在IMO 2025、CMO 2024及Putnam 2024竞赛中表现卓越,尤其在Putnam中以118/120超越人类最高分90分,并在代数、几何、数论等CNML级别问题上全面领先GPT-5-Thinking-High和Gemini 2.5-Pro。DeepSeekMath-V2采用迭代强化学习循环优化证明生成与验证,首次实现完全自动化数据标注流程,显著提升模型能力。此模型由研究员邵智宏主导开发,他曾提出经典算法GRPO并参与多个重要项目。这一成果标志着开源AI在复杂数学推理领域的重要突破。
原文链接
本文链接:https://kx.umi6.com/article/29323.html
转载请注明文章出处
相关推荐
换一换
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
2025-08-02 10:14:11
DeepSeek 推出 DeepSeekMath‑V2 模型,主打自验证数学推理能力
2025-11-27 20:52:29
DeepSeek 推出 DeepSeekMath‑V2 模型,主打自验证数学推理能力
2025-11-27 20:52:29
OpenAI正式发布GPT-5.5
2026-04-24 09:02:17
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
多重利好催化 AI硬件开启消费电子新成长周期
2026-04-23 06:53:08
刚刚,GPT-5.5发布!内测英伟达工程师:失去它像被截肢
2026-04-24 05:49:31
日本紧急成立网络安全小组 应对Mythos引发的金融系统漏洞危机
2026-04-24 18:29:17
国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家
2026-04-23 23:33:29
Gartner:阿里云稳居中国第一 份额扩大至32.8%
2026-04-24 12:09:17
Coordination Engineering关键一环,JiuwenClaw再发布Team Skills技能新范式
2026-04-24 15:16:25
千问总裁吴嘉:“AI办事”对外开放 首家接入东方航空
2026-04-23 11:02:47
英伟达参投Vast Data新一轮融资 估值升至300亿美元
2026-04-23 06:52:02
692 文章
549324 浏览
24小时热文
更多
-
2026-04-24 19:29:38 -
2026-04-24 18:31:29 -
2026-04-24 18:30:24