4月25日,英伟达发布两款专注于数学推理的AI模型——OpenMath-Nemotron-32B和OpenMath-Nemotron-14B-Kaggle。这两款基于Qwen系列transformer架构的模型,通过在OpenMathReasoning数据集上的深度微调,显著提升了复杂数学问题的解决能力。其中,OpenMath-Nemotron-32B拥有328亿参数,采用BF16张量运算优化,在AIME 2024、AIME 2025等多项基准测试中表现出色,pass@1准确率达78.4%,通过多数投票机制提升至93.3%。而OpenMath-Nemotron-14B-Kaggle作为轻量级版本,参数量为148亿,在AIMO-2 Kaggle竞赛中夺冠,CoT模式下pass@1准确率达73.7%,GenSelect模式下提升至86.7%。两款模型支持多种推理模式,并提供开源管道,集成于NeMo-Skills框架中,支持全流程复现。英伟达利用CUDA库和TensorRT技术对模型进行了GPU优化,助力高效部署。
原文链接
本文链接:https://kx.umi6.com/article/17770.html
转载请注明文章出处
相关推荐
换一换
AI 数学推理新王:英伟达发布两款 OpenMath-Nemotron 模型,刷新 AIME 准确率纪录
2025-04-25 16:17:36
智谱 GLM-4.6V 系列多模态 AI 大模型发布并开源,API 降价 50%
2025-12-08 20:45:30
OpenAI:我们的工具能让员工每天节省最多一小时专业工作时间
2025-12-08 21:49:12
Gartner 调查:仅 20% 客服支持主管表示因 AI 削减团队规模
2025-12-08 14:31:10
英伟达巧用8B模型秒掉GPT-5,开源了
2025-12-06 14:32:11
知名数学家辞职投身AI创业:老板是00后华人女生
2025-12-06 11:24:32
英伟达黄仁勋称美国三年建一座超算太慢:中国一个周末就能建一座医院
2025-12-08 23:53:52
广西“十五五”规划建议:打造面向东盟开放合作高能级平台
2025-12-07 10:24:46
跨境电商的疑难杂症,被1688这个AI全包了…
2025-12-07 13:28:44
谷歌 DeepMind CEO 哈萨比斯:规模定律是走向通用人工智能的关键
2025-12-08 09:16:34
OpenAI:科技、医疗和制造业是人工智能增长最快的行业
2025-12-08 20:47:34
Oculus 创始人拉奇为在战争中使用 AI 辩护:使用落后技术并无道德高地可言
2025-12-08 09:15:22
2025 日本国际机器人展闭幕,中国企业占据人形机器人半壁江山
2025-12-07 22:51:22
649 文章
368413 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57