OpenReasoning-Nemotron

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

英伟达推出 OpenReasoning-Nemotron 推理模型，普通游戏电脑也能玩转高级推理

7月20日，英伟达推出全新推理模型套件OpenReasoning-Nemotron，包含基于Qwen-2.5微调的1.5B、7B、14B和32B四款模型，源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”技术，大幅降低部署门槛，普通游戏电脑即可运行高级推理任务，节省GPU与云计算成本。该套件依托NeMo Skills生成的500万条数据集，采用监督学习微调，无需强化学习。测试显示，32B模型在AIME24数学竞赛中获89.2分，HMMT 2月赛达73.8分，最小的1.5B模型也有不俗表现。模型支持“GenSelect模式”，可生成多种解答版本以优化准确率，在多项基准测试中媲美甚至超越OpenAI o3-high。完整检查点已在Hugging Face开放下载，助力科研探索与定制优化。

原文链接