1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2026年3月23日,NVIDIA在GTC大会上发布全新LPU芯片,旨在重塑AI推理。首席科学家Bill Dally透露,NVIDIA正研究片上通信静态调度技术,可大幅降低延迟至30纳秒,并取消路由开销等瓶颈。Dally表示,未来单用户推理速度可达每秒1万到2万Token,较当前普遍不足100Token的速度提升显著。此外,通过优化架构和采用SRAM缓存,能耗可降低1000倍,但SRAM成本较高,LPU30仅集成500MB缓存。新技术将推动AI推理效率飞跃,为行业带来革命性变化。

原文链接
本文链接:https://kx.umi6.com/article/34062.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为即将发布AI推理领域突破性成果
2025-08-10 09:43:16
IBM 与推理 ASIC 芯片企业 Groq 达成合作,加速企业 AI 部署
2025-10-21 18:32:27
仅70W功耗!NVIDIA RTX PRO迎来两款半高新产品:还有全新服务器
2025-08-12 12:20:28
Meta 发布 ReasonIR-8B:破解 AI 复杂推理检索难题,刷新 BRIGHT 纪录
2025-05-01 16:31:24
华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源
2025-08-13 08:39:18
美国同意!黄仁勋宣布将向中国市场销售H20芯片 NVIDIA CUDA生态让中国客户离不开
2025-07-15 15:47:35
英伟达押注下一个万亿级机遇 入局AI服务器系统
2026-03-17 16:49:00
AI推理利润惊人,这里挤满了英伟达的「狙击者」
2025-08-18 17:49:02
NVIDIA称应出口最先进AI芯片:要让中国开发者习惯NVIDIA技术
2025-11-24 22:19:33
客户自研AI芯 黄仁勋丝毫不慌!NVIDIA进步很快、他们大多都会放弃
2025-06-13 19:16:02
构建可扩展的AI推理:深入了解Qualcomm AI200机架系统、板卡和AI基础设施管理套件
2026-03-03 20:31:44
黄仁勋:无法证明AI芯片违规走私到中国大陆!几乎无法追踪
2025-05-21 17:12:39
NVIDIA黄仁勋:低估华为实在太愚蠢
2025-11-12 12:01:36
24小时热文
更多
扫一扫体验小程序