英伟达开源模型Llama-Nemotron系列超越DeepSeek-R1,成为目前性能最强的开源模型。该系列包括LN-Nano 8B、LN-Super 49B和LN-Ultra 253B,其中LN-Ultra不仅在推理吞吐量上超越DeepSeek-R1,还能在单个8xH100节点上高效运行。英伟达通过合成数据监督微调和强化学习技术提升模型推理能力,并采用神经架构搜索优化推理效率。LN-Ultra在GPQA-Diamond测试中取得最佳平衡,同时支持推理开关功能,满足多场景需求。研究团队还通过大规模强化学习和偏好优化显著提升了模型的指令跟随能力和泛化能力。该成果于2025年4月发布,为开源AI领域树立了新标杆。
原文链接
本文链接:https://kx.umi6.com/article/18191.html
转载请注明文章出处
相关推荐
.png)
换一换
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
开源模型三城记
2025-07-30 10:43:17
DeepSeek低调宣称小更新,结果用2折价格达到R1水平
2025-03-25 17:07:03
超越DeepSeek?巨头们不敢说的技术暗战
2025-04-30 19:57:31
李飞飞实验室2025 AI报告出炉:AI推理成本降低至1/280
2025-04-08 23:18:28
英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录
2025-03-19 09:22:05
GRPO在《时空谜题》中击败o1、o3-mini和R1
2025-03-27 16:59:27
黄仁勋:DeepSeek R1点燃了全球热情
2025-02-27 21:42:17
OpenAI对标DeepSeek的开源模型,本周就要来了?
2025-04-14 13:32:36
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
2025-06-27 15:12:57
DeepSeek-R1秘籍轻松迁移,只需原始数据0.3% | 邱锡鹏团队联合出品
2025-02-24 16:26:25
阿里千问3推理模型更新 比肩Gemini-2.5 pro、o4-mini
2025-07-25 19:28:30
DeepSeek-V3低调发布后 业内震惊之余再次怀疑硅谷模式
2025-03-25 12:55:22
520 文章
185490 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17