11月27日,DeepSeek发布DeepSeekMath-V2模型,主打自验证数学推理能力。该模型通过构建基于LLM的验证器,对生成的证明进行自动审查,并利用扩展计算生成高难度训练样本提升验证能力。在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中,模型均达到金牌水准,同时在2024年普特南数学竞赛(Putnam 2024)中取得118/120的优异成绩。官方表示,这一成果验证了可自验证数学推理的可行性,为未来更强大、可靠的数学智能系统奠定基础。项目已开源,详情可参考Hugging Face与GitHub页面。
原文链接
本文链接:https://kx.umi6.com/article/29296.html
转载请注明文章出处
相关推荐
换一换
DeepSeek再破谷歌OpenAI垄断:开源IMO数学金牌大模型
2025-11-28 13:28:13
563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34
2024-06-16 13:41:35
DeepSeek 推出 DeepSeekMath‑V2 模型,主打自验证数学推理能力
2025-11-27 20:52:29
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k
2026-03-09 15:50:15
抖音电商打击AI虚假营销:处置仿冒李亚鹏、王丽云等名人侵权内容超16万条
2026-03-09 19:06:14
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
阿莱德:目前公司仅有极个别订单最终交货地位于迪拜 涉及订单金额占公司整体营收比例不足1%
2026-03-06 11:58:07
AI“养龙虾”走红 专家建议:部署OpenClaw关闭不必要的公网访问
2026-03-09 20:09:18
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
劝视频博主别拿龙虾起号 7×24小时全自动 碳基生物真卷不过
2026-03-07 00:47:12
腾讯版“小龙虾”WorkBuddy正式上线
2026-03-09 15:52:31
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
OpenClaw火出天际 工程院院士王坚:AI龙虾价格很快打下来
2026-03-08 19:34:04
679 文章
478684 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18