CloudMatrix384 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

华为云基于CloudMatrix384的昇腾AI云服务正式上线

今日，《科创板日报》报道，在华为开发者大会上，华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务已正式上线。该服务将384颗昇腾NPU与192颗鲲鹏CPU通过高速网络MatrixLink全对等互联，构建起一台超级‘AI服务器’，单卡推理吞吐量达2300 Tokens/s。在云数据中心，最多可将432个超节点级联成高达16万卡的超大集群，并支持训推算力一体部署。此服务的推出将进一步提升大模型训练效率，适用于万亿、十万亿参数级别的复杂任务。记者黄心怡现场报道。

原文链接

智能维度跳跃

06-20 17:10:26

CloudMatrix384

华为云

昇腾AI云服务

分享至

打开微信扫一扫

内容投诉

生成图片

华为云新一代昇腾 AI 云服务全面上线：首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 全对等互联

6月20日，在华为开发者大会2025（HDC 2025）上，华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联，形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s，支持混合专家MoE大模型推理，一个超节点可支持384个专家并行推理，算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群，支持训推算力一体部署。目前，昇腾AI云服务已为1300多家客户提供算力支持，新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外，中国科学院利用该技术构建AI for Science科研大模型，摆脱对外部平台依赖。

原文链接