英伟达于9月10日发布首款专为大规模上下文AI设计的CUDA GPU——Rubin CPX。该GPU具备128GB GDDR7显存,支持3倍attention能力,并通过4-bit NVFP4精度提供30 petaflops计算性能,适用于大规模编码和生成视频等高需求任务。新产品将作为Vera Rubin平台的一部分,全机架版本NVL144 CPX可达8 exaflops AI性能。英伟达CEO黄仁勋称其革新了大规模上下文AI处理,并预计1亿美元投资可带来50亿美元收益。Rubin CPX将支持英伟达完整软件栈,包括多模态模型Nemotron系列,预计2026年底正式推出。
原文链接
本文链接:https://kx.umi6.com/article/24950.html
转载请注明文章出处
相关推荐
换一换
英伟达拟向两家光学公司各投20亿美元 加码AI算力生态
2026-03-02 23:09:04
告别马赛克画质!英伟达高管:未来游戏画质可靠AI实现100万倍的跨越
2026-03-15 18:51:33
英伟达CEO黄仁勋:未来十年世界上大部分汽车将实现自动驾驶或高度自动驾驶
2026-01-06 15:13:14
微软和英伟达宣布合作开发核能许可与设计工具
2026-03-24 23:33:47
英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列,吞吐量达上一代 4 倍
2025-12-15 23:04:58
英伟达首台DGX GB300,老黄亲自登门送给他
2026-03-19 16:07:45
英伟达CEO黄仁勋:AGI时代已经到来 “龙虾开公司”不是梦
2026-03-25 11:26:47
英伟达将豪掷260亿美元开发AI大模型
2026-03-12 11:33:39
不用额外缓存!英伟达开源大模型记忆压缩方案,128K上下文提速2.7倍
2026-01-14 14:38:03
10 万亿 tokens!英伟达贡献全球最大规模开源数据集,并推四大开源 AI 模型
2026-01-06 06:48:15
英伟达回应:未收购Groq 聘请了Groq人才加入英伟达
2025-12-25 13:38:36
英伟达遭版权诉讼,被指联系影子图书馆获取 500TB 盗版数据
2026-01-20 19:25:39
联想与英伟达合作打造吉瓦级 AI 工厂,杨元庆、黄仁勋同台亮相
2026-01-07 10:59:33
725 文章
534223 浏览
24小时热文
更多
-
2026-03-31 15:55:40 -
2026-03-31 15:54:49 -
2026-03-31 15:54:35