英伟达开源9B参数小模型，比Qwen3快6倍

2025-08-19 16:03:42

量子思考者

发布在

快讯

阅读：69

2025年8月，英伟达发布并开源了新型小型语言模型Nemotron Nano v2，参数规模为9B。该模型在复杂推理任务中的准确率与Qwen3-8B相当或更高，但速度提升6倍，支持‘思考’预算控制以优化推理过程。其训练基于20万亿token的超大规模数据集，并通过多阶段后训练和压缩技术实现高效性能，可在单个NVIDIA A10G GPU上运行128k上下文推理。同时，英伟达首次开源了用于训练的绝大部分数据，包括66万亿token的高质量预训练语料库，涵盖多语言、数学、代码等领域。此次发布是英伟达开源战略的一部分，对标的正是国内开源模型Qwen3，引发业界关注。模型已开放在线试用。

原文链接

本文链接：https://kx.umi6.com/article/23814.html

转载请注明文章出处

Nemotron Nano v2