4月30日,DeepSeek推出数学定理证明专用模型DeepSeek-Prover-V2,参数规模达671B,miniF2F测试通过率达88.9%,显著优于前代V1.5及月之暗面的Kimina-Prover(通过率80.7%)。DeepSeek-Prover-V2基于强化学习和子目标分解技术,延续其模型矩阵同步进化策略。此前,梁文锋与杨植麟曾在2月论文中“撞车”,双方均聚焦Transformer架构的注意力机制。当前,DeepSeek面临阿里巴巴通义千问Qwen3(参数量1/3,性能超越R1)和百度文心4.5 Turbo的竞争压力;而月之暗面的Kimi则需应对腾讯元宝的用户增长冲击,后者一季度投流费用达14亿元。DeepSeek正加速研发R2和V4版本,但市场对其依赖华为昇腾芯片存疑。业内呼吁中国大模型产业需多元竞争,而非一家独大。
原文链接
本文链接:https://kx.umi6.com/article/18460.html
转载请注明文章出处
相关推荐
换一换
国泰海通:谷歌Gemini 3实现断层式领先 大模型竞争格局加速重构
2025-11-20 21:45:30
大模型竞争:美国抢人,中国裁人
2025-06-25 17:49:18
大模型竞争:落后生的两条追赶路线
2025-06-26 14:58:54
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题
2025-05-20 16:41:45
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
2025-05-05 09:43:44
梁文锋,与杨植麟再「撞车」
2025-05-12 15:36:02
DeepSeek开源新模型,数学推理能力大提升
2025-05-01 09:16:24
DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆
2025-05-01 10:18:39
20岁大学生花10天VibeCoding一个开源项目,获盛大3000万投资
2026-03-08 16:13:04
超智算智能算力中心揭牌暨AI算力设备点亮仪式成功举行
2026-03-06 20:29:36
郑栅洁:从未来发展考虑 将推进人工智能超大规模智算集群、卫星互联网、可控核聚变等一系列重大工程和项目
2026-03-06 17:23:58
高德发布全球首个由大模型驱动的视觉认知步行导引系统
2026-03-06 19:28:12
688 文章
486310 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18