2025年9月10日,英伟达宣布推出专为长上下文工作负载设计的GPU芯片Rubin CPX,显著提升AI推理效率,特别是在编程和视频生成等需要超长上下文的应用场景。Rubin CPX基于下一代顶级算力芯片Rubin开发,预计2026年底出货。新芯片将集成在NVIDIA Vera Rubin NVL144 CPX服务器中,性能较当前旗舰GB300 NVL72提升最多6.5倍,提供8exaFLOPs算力、100TB高速内存和1.7PB/s带宽。英伟达表示,部署价值1亿美元的新芯片可为客户带来50亿美元收入。Rubin CPX针对数百万tokens级别的长上下文优化,配备30petaFLOPs算力和128GB GDDR7内存,分离上下文与生成阶段计算负载,大幅提升资源利用率。
原文链接
本文链接:https://kx.umi6.com/article/24958.html
转载请注明文章出处
相关推荐
换一换
阿联酋AI公司G42据悉寻求芯片供应多元化 避免过于依赖英伟达
2025-09-01 23:26:31
英伟达千亿美元投OpenAI,全是套路?
2025-09-24 10:35:59
英伟达AI超级计算机DGX Spark™正式交付
2025-10-14 13:17:28
黄仁勋:合作将英伟达AI和英特尔CPU紧密结合在一起
2025-09-18 20:03:52
瑞银:预计2026年英伟达CoWoS晶圆需求将达67.8万片 同比增近40%
2025-10-11 10:52:46
全是套路!英伟达千亿美元投OpenAI,奥特曼拿钱买卡还让甲骨文赚差价
2025-09-23 10:11:38
业内人士:OpenAI与甲骨文和英伟达合作形成商业闭环
2025-09-24 18:51:20
英伟达CEO黄仁勋将访韩出席APEC工商峰会
2025-10-19 13:49:24
双“英”恩仇:英特尔和英伟达的三十年
2025-10-01 20:50:48
AI闭环背后英伟达“幸福的烦恼”:钱太多、花不完
2025-09-24 15:48:05
英伟达开源 Audio2Face 模型:AI 实时生成面部动画,多语言口型同步
2025-09-25 07:55:46
集邦预计:英伟达 2026 年 HBM4 供应由 SK 海力士主导,若调高速度要求有利于三星
2025-09-19 16:18:58
阿里巴巴宣布与英伟达开展Physical AI合作
2025-09-24 15:49:08
489 文章
226256 浏览
24小时热文
更多
-
2025-10-26 00:45:16 -
2025-10-25 23:44:04 -
2025-10-25 22:43:52