1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

7月20日,英伟达推出全新推理模型套件OpenReasoning-Nemotron,包含基于Qwen-2.5微调的1.5B、7B、14B和32B四款模型,源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”技术,大幅降低部署门槛,普通游戏电脑即可运行高级推理任务,节省GPU与云计算成本。该套件依托NeMo Skills生成的500万条数据集,采用监督学习微调,无需强化学习。测试显示,32B模型在AIME24数学竞赛中获89.2分,HMMT 2月赛达73.8分,最小的1.5B模型也有不俗表现。模型支持“GenSelect模式”,可生成多种解答版本以优化准确率,在多项基准测试中媲美甚至超越OpenAI o3-high。完整检查点已在Hugging Face开放下载,助力科研探索与定制优化。

原文链接
本文链接:https://kx.umi6.com/article/22073.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
2025-06-13 12:06:17
“太晚了,追不上英伟达了”:英特尔新CEO 内部讲话泄露
2025-07-12 13:52:04
高调买地建厂!全球股王英伟达要在以色列大干一场
2025-07-10 17:28:48
24小时热文
更多
扫一扫体验小程序