2025年9月10日,英伟达宣布推出专为长上下文工作负载设计的GPU芯片Rubin CPX,显著提升AI推理效率,特别是在编程和视频生成等需要超长上下文的应用场景。Rubin CPX基于下一代顶级算力芯片Rubin开发,预计2026年底出货。新芯片将集成在NVIDIA Vera Rubin NVL144 CPX服务器中,性能较当前旗舰GB300 NVL72提升最多6.5倍,提供8exaFLOPs算力、100TB高速内存和1.7PB/s带宽。英伟达表示,部署价值1亿美元的新芯片可为客户带来50亿美元收入。Rubin CPX针对数百万tokens级别的长上下文优化,配备30petaFLOPs算力和128GB GDDR7内存,分离上下文与生成阶段计算负载,大幅提升资源利用率。
原文链接
本文链接:https://kx.umi6.com/article/24958.html
转载请注明文章出处
相关推荐
.png)
换一换
老黄太难了!英伟达Q2营收467亿美元创纪录,股价盘后还跌了5%
2025-08-28 09:13:30
黄仁勋亲笔签名预告贺卡,英伟达将为人形机器人推“新大脑”
2025-08-25 09:26:14
黄仁勋向特朗普呼吁:美国科技公司不能被排除出中国市场
2025-08-28 12:21:12
苹果向英伟达生态妥协了!MLX框架主动适配CUDA
2025-07-17 14:22:02
中国贸促会会长任鸿斌会见美国英伟达公司创始人兼首席执行官黄仁勋
2025-07-15 18:48:46
高盛:维持英伟达“买入”评级 未来12个月目标价200美元
2025-08-28 15:26:53
消息称谷歌正打破 TPU 完全自托管局面,强化与英伟达 AI 芯片竞争
2025-09-04 09:58:59
白宫:英伟达、AMD上缴15%在华收入 或扩大至更多公司
2025-08-13 15:43:53
硅谷版的“莞莞类卿”?分析师称博通业绩增速令人想起早年的英伟达
2025-09-06 15:35:56
黄仁勋做营销,比雷军还猛
2025-07-20 15:09:13
老黄投了个120亿美元最贵种子轮!但小钱:H20中国开卖,市值一夜暴涨1600亿美元
2025-07-16 11:00:09
万亿对决:苹果vs英伟达
2025-08-29 14:41:02
英伟达Q2数据中心营收未达预期 盘后一度大跌超5%
2025-08-28 09:16:04
450 文章
155561 浏览
- 英伟达发布超长上下文推理芯片Rubin CPX 算力效率拉爆当前旗舰
- 发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
- 中国气象局推动 AI 天气预报模型创新融合应用,伏羲、璞云、风乌、风清、盘古等入选
- OpenAI内部大重组
- 马斯克“金色擎天柱”首曝,一双“真人手”刷屏
阅读更多
24小时热文
更多

-
2025-09-10 11:37:23
-
2025-09-10 11:36:16
-
2025-09-10 11:35:05