2025年11月,DeepSeek开源全新数学模型DeepSeekMath-V2,专注自验证数学推理,打破谷歌和OpenAI在该领域的垄断。该模型在IMO 2025、CMO 2024及Putnam 2024竞赛中表现卓越,尤其在Putnam中以118/120超越人类最高分90分,并在代数、几何、数论等CNML级别问题上全面领先GPT-5-Thinking-High和Gemini 2.5-Pro。DeepSeekMath-V2采用迭代强化学习循环优化证明生成与验证,首次实现完全自动化数据标注流程,显著提升模型能力。此模型由研究员邵智宏主导开发,他曾提出经典算法GRPO并参与多个重要项目。这一成果标志着开源AI在复杂数学推理领域的重要突破。
原文链接
本文链接:https://kx.umi6.com/article/29323.html
转载请注明文章出处
相关推荐
换一换
DeepSeek 推出 DeepSeekMath‑V2 模型,主打自验证数学推理能力
2025-11-27 20:52:29
DeepSeek再破谷歌OpenAI垄断:开源IMO数学金牌大模型
2025-11-28 13:28:13
谷歌IMO金牌模型可以用了!推理性能秒了o3、Grok 4
2025-08-02 10:14:11
国家发展改革委主任:“十五五”末人工智能相关产业规模将增长到10万亿元以上
2026-03-06 16:15:23
AI出错为何不用承担责任!最高法厘清法律责任边界
2026-03-09 18:02:29
暴雪皮克斯老兵的AI社交实验:用声音匹配,MAU破260万,估值1.5亿美金
2026-03-09 13:39:33
最高法:打击滥用AI换脸等行为 斩断为电诈提供“技术助攻”的链条
2026-03-09 15:54:50
超算互联网:OpenClaw正式打通飞书、企业微信
2026-03-09 14:48:46
千问首款AI硬件 千问AI眼镜G1开售:首创热插拔换电 无限续航 国补1997元起
2026-03-08 09:51:13
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
AI“养龙虾”走红 专家建议:部署OpenClaw关闭不必要的公网访问
2026-03-09 20:09:18
“办事”成全球AI新焦点:谷歌OpenAI相继投入 千问再加码
2026-03-06 18:25:27
OpenClaw最强外挂出现:小龙虾抓不到数据有救了!
2026-03-08 18:27:06
663 文章
457431 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18