11月4日,微软宣布其Azure ND GB300 v6虚拟机在运行Meta的Llama2 70B模型时,推理速度达到每秒110万个token,刷新AI推理纪录。该虚拟机由英伟达Blackwell Ultra GPU驱动,基于NVIDIA GB300 NVL72系统,集成72颗GPU和36颗Grace CPU,专为推理优化。测试使用MLPerf Inference v5.1基准与NVIDIA TensorRT-LLM引擎,单个NVL72机架实现总计110万token/秒吞吐量,较上一代提升27%,功耗仅增17%。Signal65验证结果显示,相比H100世代,GB300推理性能提升近10倍,能效比提高2.5倍。微软CEO纳德拉称此成就得益于与英伟达长期合作。
原文链接
本文链接:https://kx.umi6.com/article/27834.html
转载请注明文章出处
相关推荐
换一换
两个月斩获微软四笔订单 “英版甲骨文”或计划明年IPO
2025-10-16 00:43:21
英伟达中国开发者日2025即将开启
2025-11-03 21:42:46
加码英伟达 AI 芯片,微软再签两笔合计超百亿美元云算力订单
2025-11-04 10:08:19
AI算力大单满天飞!微软与云计算创企Lambda达成数十亿美元协议
2025-11-04 11:09:58
英伟达推出 Blackwell 世代机器人处理器 IGX Thor,AI 算力 5581 TFLOPS
2025-11-02 00:55:11
英伟达证实投资xAI 黄仁勋遗憾强调:可惜不能投更多!
2025-10-09 09:22:33
IBM 与推理 ASIC 芯片企业 Groq 达成合作,加速企业 AI 部署
2025-10-21 18:32:27
“大空头”真出手了!伯里提前两周发13F报告:做空英伟达和Palantir
2025-11-04 15:24:02
减少对英伟达、AMD 依赖,微软未来 AI 数据中心计划主要使用自研芯片
2025-10-02 12:12:41
富士通、英伟达扩大战略合作,将携手推出行业 AI 智能体平台与算力基础设施
2025-10-04 18:05:10
云业务助微软Q3业绩超预期 但创纪录资本支出成市场阴影
2025-10-30 08:32:56
20 万块 GB300、140 亿美元,微软与 AI 云 Nscale 达成重大交易
2025-10-16 14:57:12
英伟达CEO黄仁勋将访韩出席APEC工商峰会
2025-10-19 13:49:24
561 文章
297398 浏览
24小时热文
更多
-
2025-11-05 18:18:57 -
2025-11-05 18:18:05 -
2025-11-05 18:17:53