2025年8月,英伟达韩松团队推出全新高效语言模型Jet-Nemotron,基于后神经架构搜索(PostNAS)技术。该模型在MMLU等基准测试中表现优异,吞吐量较Qwen3-1.7B快47倍,缓存缩小至1/47,同时在数学、常识推理、编码等任务上超越多个基线模型。研究团队通过全注意力层优化、动态卷积模块设计及硬件感知搜索提升效率,并计划开源代码与模型。团队成员均来自华人学者,包括清华大学、麻省理工学院等顶尖机构的研究人员。这一成果显著推进了高效语言模型的发展。
原文链接
本文链接:https://kx.umi6.com/article/24232.html
转载请注明文章出处
相关推荐
换一换
英伟达韩松团队新作:具有后神经架构搜索的高效语言模型
2025-08-26 19:51:52
马斯克新模型背后算法来自英伟达???
2025-09-26 16:31:12
三星:考虑与多家AI公司建立合作 押注“多AI模型”手机战略
2026-03-09 20:09:26
智谱上线AutoClaw(澳龙)
2026-03-10 09:00:02
20岁大学生花10天VibeCoding一个开源项目,获盛大3000万投资
2026-03-08 16:13:04
农业农村部部长韩俊:目前智能采摘机器人、智能灌溉机器人、AI激光除草机器人等已在农业上开始使用
2026-03-09 11:34:34
OpenAI将收购人工智能安全平台Promptfoo
2026-03-10 08:58:57
北京市新增1款已完成备案生成式人工智能服务
2026-03-10 10:03:26
国产AI短剧《霍去病》火到海外 播放量超5亿!3000元成本、3人团队5天产出80集
2026-03-06 17:20:41
看完背后冷汗流!研究:先拥抱AI的行业或许会先被AI吃掉
2026-03-07 08:16:24
华泰证券:美以伊冲突下油价高涨或将推升电价
2026-03-10 09:02:22
超智算智能算力中心揭牌暨AI算力设备点亮仪式成功举行
2026-03-06 20:29:36
中信证券:主动补库周期来临 特种布基本面将加速赶超
2026-03-10 09:01:12
640 文章
428988 浏览
24小时热文
更多
-
2026-03-10 10:03:26 -
2026-03-10 10:02:35 -
2026-03-10 09:02:22