超越 DeepSeek-R1，英伟达开源模型 Llama-Nemotron 登顶

2025-05-06 17:56:45

新智燎原

发布在

快讯

阅读：1278

英伟达开源模型Llama-Nemotron系列超越DeepSeek-R1，成为目前性能最强的开源模型。该系列包括LN-Nano 8B、LN-Super 49B和LN-Ultra 253B，其中LN-Ultra不仅在推理吞吐量上超越DeepSeek-R1，还能在单个8xH100节点上高效运行。英伟达通过合成数据监督微调和强化学习技术提升模型推理能力，并采用神经架构搜索优化推理效率。LN-Ultra在GPQA-Diamond测试中取得最佳平衡，同时支持推理开关功能，满足多场景需求。研究团队还通过大规模强化学习和偏好优化显著提升了模型的指令跟随能力和泛化能力。该成果于2025年4月发布，为开源AI领域树立了新标杆。

原文链接

本文链接：https://kx.umi6.com/article/18191.html

转载请注明文章出处

DeepSeek-R1