1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
梁文锋,与杨植麟再「撞车」
4月30日,DeepSeek推出数学定理证明专用模型DeepSeek-Prover-V2,参数规模达671B,miniF2F测试通过率达88.9%,显著优于前代V1.5及月之暗面的Kimina-Prover(通过率80.7%)。DeepSeek-Prover-V2基于强化学习和子目标分解技术,延续其模型矩阵同步进化策略。此前,梁文锋与杨植麟曾在2月论文中“撞车”,双方均聚焦Transformer架构的注意力机制。当前,DeepSeek面临阿里巴巴通义千问Qwen3(参数量1/3,性能超越R1)和百度文心4.5 Turbo的竞争压力;而月之暗面的Kimi则需应对腾讯元宝的用户增长冲击,后者一季度投流费用达14亿元。DeepSeek正加速研发R2和V4版本,但市场对其依赖华为昇腾芯片存疑。业内呼吁中国大模型产业需多元竞争,而非一家独大。
星际Code流浪者
05-12 15:36:02
DeepSeek-Prover-V2
大模型竞争
数学定理证明
分享至
打开微信扫一扫
内容投诉
生成图片
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
近日,深度学习模型DeepSeek-Prover-V2发布,包含7B和671B参数两种版本。该模型通过递归强化学习提升数学推理能力,在多项基准测试中表现出色。671B版本在MiniF2F-test上达到88.9%的通过率,显著优于现有开源模型。论文指出,模型通过冷启动数据合成及强化学习技术,将非形式化推理与形式化证明结合,实现高效数学证明。此外,7B小模型在特定任务中表现优异,解决了一些671B未完成的问题。DeepSeek-Prover-V2已在Hugging Face和GitHub开源,未来目标是攻克IMO级别难题。
AI奇点纪元
05-05 09:43:44
DeepSeek-Prover-V2
强化学习
数学推理
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
DeepSeek放大招!新模型DeepSeek-Prover-V2专注于数学定理证明,刷新多项高难度基准测试记录。在普特南测试中,该模型成功解答49道题,远超目前排名第一的Kimina-Prover(仅解出10题)。而未优化的DeepSeek-R1仅解出1题,令人期待R2的表现。 论文中特别提到“通...
WisdomTrail
05-01 13:22:40
DeepSeek-Prover-V2
强化学习
数学定理证明
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆
4月30日,深度求索(DeepSeek)在Hugging Face上发布DeepSeek-Prover-V2-671B新模型。该模型专注于形式化数学推理,基于DeepSeek-V3-0324,采用递归定理证明管道生成初始数据。DeepSeek推出671B参数的DeepSeek-Prover-V2-671B和7B参数的DeepSeek-Prover-V2-7B两款模型,以及ProverBench数据集。团队通过分解复杂定理为子目标,并利用7B模型处理子目标证明,结合DeepSeek-V3的思维链生成强化学习数据。最终,671B版本在MiniF2F-test数据集上达到88.9%通过率,在PutnamBench数据集中解决问题49个。ProverBench数据集包含325个数学问题,覆盖高中竞赛及本科数学领域,推动AI数学推理能力的评估与应用。
跨界思维
05-01 10:18:39
DeepSeek-Prover-V2
定理证明
数学推理
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek开源新模型,数学推理能力大提升
DeepSeek开源新模型,数学推理能力大提升 五一假期前,DeepSeek发布惊喜——DeepSeek-Prover-V2在Hugging Face上线,同步提供模型卡与示例代码。该版本包括两个模型:DeepSeek-Prover-V2-7B(基于V1.5,支持32K上下文输入)和DeepSe...
月光编码师
05-01 09:16:24
DeepSeek-Prover-V2
开源
数学推理
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek发布Prover-V2模型 参数量达6710亿
今日,《科创板日报》报道,人工智能公司DeepSeek在AI开源社区Hugging Face发布了全新模型DeepSeek-Prover-V2-671B。该模型参数量高达6710亿,是Prover-V1.5的升级版,采用更高效的safetensors文件格式并支持多计算精度,便于快速训练与部署。其架构基于DeepSeek-V3,运用MoE混合专家模式,含61层Transformer层及7168维隐藏层,支持超长上下文,最大位置嵌入达16.38万,可高效处理复杂数学证明任务。此外,模型通过FP8量化技术优化推理效率,减小模型体积。此模型的发布标志着深度学习领域的重要进展,值得关注。
元界筑梦师
04-30 20:46:01
DeepSeek-Prover-V2-671B
模型参数
混合专家
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-Prover-V2-671B 新模型开源发布
4月30日,AI模型DeepSeek-Prover-V2-671B在Hugging Face开源发布。该模型由DeepSeek推出,参数量达6710亿,据推测是Prover-V1.5的升级版本。它采用更高效的safetensors文件格式,并支持BF16、FP8、F32等多种计算精度,有助于提升训练和部署效率。目前,DeepSeek尚未公开其具体性能数据。开源地址:
AI思维矩阵
04-30 19:50:58
AI模型
DeepSeek-Prover-V2-671B
开源
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序