4月11日,英伟达发布大型语言模型Llama-3.1-Nemotron-Ultra-253B-v1(简称Nemotron Ultra),该模型拥有2530亿参数,在推理能力、架构效率及生产准备度方面取得重大进展。作为Meta Llama-3.1-405B-Instruct架构的升级版,Nemotron Ultra专为企业和开发者设计,支持复杂指令执行及多轮对话。该模型采用创新的跳跃注意力机制,部分层省略或替换注意力模块,并通过前馈网络融合技术提升效率,上下文窗口可达128K token,适合长文本处理。在部署方面,Nemotron Ultra可在单个8xH100节点上高效运行,大幅降低数据中心成本。此外,英伟达通过多阶段后训练优化,包括监督微调和强化学习(RL),使其在多项基准测试中表现优异。
原文链接
本文链接:https://kx.umi6.com/article/17063.html
转载请注明文章出处
相关推荐
.png)
换一换
AI热潮和互联网浪潮,区别在哪?
2024-06-26 15:51:46
苹果计划在2026年推出Siri改版 增加更多自研人工智能
2024-11-22 05:52:14
分析 1400 万篇论文发现:“AI 味”非常浓,中国使用 LLM 比例高达 35%
2024-06-28 09:15:03
431 文章
72217 浏览
24小时热文
更多

-
2025-07-19 15:54:36
-
2025-07-19 15:54:26
-
2025-07-19 14:57:21