4月25日,英伟达发布两款专注于数学推理的AI模型——OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle。这两款基于Qwen系列transformer架构的模型,通过在OpenMathReasoning数据集上的深度微调,显著提升了复杂数学问题的解决能力。其中,OpenMath-Nemotron-32B拥有328亿参数,采用BF16张量运算优化,在AIME 2024、AIME 2025等多项基准测试中表现出色,pass@1准确率达78.4%,通过多数投票机制提升至93.3%。而OpenMath-Nemotron-14B-Kaggle作为轻量级版本,参数量为148亿,在AIMO-2 Kaggle竞赛中夺冠,CoT模式下pass@1准确率达73.7%,GenSelect模式下提升至86.7%。两款模型支持多种推理模式,并提供开源管道,集成于NeMo-Skills框架中,支持全流程复现。英伟达利用CUDA库和TensorRT技术对模型进行了GPU优化,助力高效部署。
原文链接
本文链接:https://kx.umi6.com/article/17770.html
转载请注明文章出处
相关推荐
.png)
换一换
2025 上半年具身智能融资复盘:金额超 200 亿、头部收敛趋势明显、传统制造业巨头增多
2025-07-17 18:29:16
AI学习机在「下沉」
2025-07-18 12:37:30
AI 智能体竞赛迈入新阶段,浏览器成“兵家必争之地”
2025-07-19 11:52:20
468 文章
68784 浏览
24小时热文
更多

-
2025-07-19 12:53:03
-
2025-07-19 12:51:53
-
2025-07-19 11:52:20