9月13日,AI领域焦点从模型参数增长转向推理算力需求。英伟达发布专为长上下文推理设计的Rubin CPX GPU,称其投资回报率可达50倍,远超以往产品,并在MLPerf推理基准测试中创纪录。甲骨文创始人Larry Ellison指出,AI推理市场将远大于训练市场,且推理算力正被快速耗尽。数据显示,Google、微软和字节等大厂Token调用量呈爆发式增长,行业对长上下文需求激增。东吴证券认为,Rubin CPX推出标志着算力基建进入分工协作新阶段,硬件与软件耦合度提升,GPU、存储等相关厂商有望受益。
原文链接
本文链接:https://kx.umi6.com/article/25177.html
转载请注明文章出处
相关推荐
换一换
杨植麟GTC上披露Kimi技术路线:押注Token效率、长上下文及Agent集群
2026-03-18 12:13:34
周鸿祎:推理算力才是未来 让AI不仅能读清华 更能真正赚大钱
2025-10-11 10:26:15
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025-07-11 11:34:58
DeepSeek狂潮下,九张图表详解智算市场走向
2025-02-20 12:10:30
中国,正在批量制造AI印钞机
2025-04-16 16:07:51
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
2025-04-15 10:24:50
MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步
2025-07-22 13:32:06
MiniMax的好日子来了?
2025-06-18 21:51:36
英伟达发布新一代GPU 推理算力是Blackwell的5倍
2026-01-06 07:55:49
这份未来AI竞争形势分析,连马斯克也拍手叫好?一文读懂
2025-02-24 11:26:02
民生证券:再次强调国产AI算力预期差下的大机遇
2025-03-09 15:53:11
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
2025-01-16 10:52:27
Gemini 2.5 Pro负责人:最强百万上下文,做好了能解锁很多应用场景
2025-07-01 08:52:17
723 文章
583266 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17