
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月20日,英伟达推出全新推理模型套件OpenReasoning-Nemotron,包含基于Qwen-2.5微调的1.5B、7B、14B和32B四款模型,源自6710亿参数的DeepSeek R1 0528大模型。通过“蒸馏”技术,大幅降低部署门槛,普通游戏电脑即可运行高级推理任务,节省GPU与云计算成本。该套件依托NeMo Skills生成的500万条数据集,采用监督学习微调,无需强化学习。测试显示,32B模型在AIME24数学竞赛中获89.2分,HMMT 2月赛达73.8分,最小的1.5B模型也有不俗表现。模型支持“GenSelect模式”,可生成多种解答版本以优化准确率,在多项基准测试中媲美甚至超越OpenAI o3-high。完整检查点已在Hugging Face开放下载,助力科研探索与定制优化。
原文链接
加载更多

暂无内容