2025年9月,马斯克旗下xAI团队的Grok-4-fast模型因高效推理表现引发关注,其背后可能与英伟达最新算法论文相关。英伟达研究团队提出一种名为Jet-Nemotron的混合结构模型,通过PostNAS框架大幅优化推理效率,速度提升可达53倍,同时显著降低硬件成本和内存需求。该技术采用动态卷积、硬件感知架构搜索等创新方法,适用于任何预训练Transformer模型,并已开源。尽管Grok-4-fast是否直接使用Jet-Nemotron尚无官方证实,但两者性能高度相似,且定价降幅与论文预测一致(20至50倍)。此外,这一突破性研究由华人学者主导,包括清华博士生顾煜贤及英伟达科学家Han Cai,展现了华人科研力量的重要贡献。
原文链接
本文链接:https://kx.umi6.com/article/25943.html
转载请注明文章出处
相关推荐
换一换
马斯克新模型背后算法来自英伟达???
2025-09-26 16:31:12
英伟达韩松团队新作:具有后神经架构搜索的高效语言模型
2025-08-26 19:51:52
叫板谷歌!马斯克xAI发布Grok-4-Fast 性能比肩Gemini 2.5
2025-09-21 16:46:00
杭州:到2030年培育国际顶尖水平的开源基础大模型3个以上
2026-01-21 13:13:30
亚马逊推出医疗保健工具Health AI
2026-01-22 14:58:16
商务部等9部门:推动药品零售企业监管向服务型监管、预防型监管、数智化治理转变
2026-01-22 17:04:48
成都国资开年「闪击战」背后的产业野望
2026-01-21 20:24:37
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
突发!xAI联创杨格过劳病离职,给马斯克干活压力山大
2026-01-21 17:21:29
欧盟提出《数字网络法案》拟统一网络连接规则
2026-01-21 19:24:13
卢宗青团队新作:人类先验打底,统一动作对齐,通用机器人模型正在落地
2026-01-22 17:03:53
成立两年半登顶全球AI创作社区,背后是中国团队在“卖情绪”??
2026-01-22 20:08:53
665 文章
456992 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34