
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
今日,《科创板日报》报道,在华为开发者大会上,华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务已正式上线。该服务将384颗昇腾NPU与192颗鲲鹏CPU通过高速网络MatrixLink全对等互联,构建起一台超级‘AI服务器’,单卡推理吞吐量达2300 Tokens/s。在云数据中心,最多可将432个超节点级联成高达16万卡的超大集群,并支持训推算力一体部署。此服务的推出将进一步提升大模型训练效率,适用于万亿、十万亿参数级别的复杂任务。记者黄心怡现场报道。
原文链接
6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
加载更多

暂无内容