英伟达开源模型Llama-Nemotron系列超越DeepSeek-R1,成为目前性能最强的开源模型。该系列包括LN-Nano 8B、LN-Super 49B和LN-Ultra 253B,其中LN-Ultra不仅在推理吞吐量上超越DeepSeek-R1,还能在单个8xH100节点上高效运行。英伟达通过合成数据监督微调和强化学习技术提升模型推理能力,并采用神经架构搜索优化推理效率。LN-Ultra在GPQA-Diamond测试中取得最佳平衡,同时支持推理开关功能,满足多场景需求。研究团队还通过大规模强化学习和偏好优化显著提升了模型的指令跟随能力和泛化能力。该成果于2025年4月发布,为开源AI领域树立了新标杆。
原文链接
本文链接:https://kx.umi6.com/article/18191.html
转载请注明文章出处
相关推荐
.png)
换一换
Claude竟藏着3307种「人格」?深扒70万次对话,这个AI会看人下菜碟
2025-05-05 09:40:29
麦当劳已经用类Sora模型,制作商业广告啦!
2024-08-19 16:25:25
空间智能火了 3D生成迎来大爆发?业内人士这样看|聚焦
2024-12-06 20:33:00
471 文章
78422 浏览
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21