1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
NVIDIA要重塑AI:单用户速度可达2万Token每秒、能耗降1000倍
2026年3月23日,NVIDIA在GTC大会上发布全新LPU芯片,旨在重塑AI推理。首席科学家Bill Dally透露,NVIDIA正研究片上通信静态调度技术,可大幅降低延迟至30纳秒,并取消路由开销等瓶颈。Dally表示,未来单用户推理速度可达每秒1万到2万Token,较当前普遍不足100Token的速度提升显著。此外,通过优化架构和采用SRAM缓存,能耗可降低1000倍,但SRAM成本较高,LPU30仅集成500MB缓存。新技术将推动AI推理效率飞跃,为行业带来革命性变化。
智能视野
03-23 20:44:37
AI推理
LPU芯片
Nvidia
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序