6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
本文链接:https://kx.umi6.com/article/20538.html
转载请注明文章出处
相关推荐
.png)
换一换
华为云董理斌:盘古西语及葡语NLP大模型将于Q3发布
2025-05-20 21:47:31
蚂蚁集团百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署
2025-10-18 20:38:01
DeepSeek-V3.2-Exp第一时间上线华为云
2025-09-30 00:16:10
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
华为发布准万亿模型盘古Ultra MoE
2025-05-30 17:00:15
华为云CloudMatrix384超节点AI Token服务全面上线
2025-09-19 11:16:25
华为云董理斌:大模型创新需围绕企业生产场景、核心场景展开
2024-07-06 05:42:11
独家|华为联合软通动力、道和通泰等探索具身智能落地
2025-06-23 10:30:40
华为云创业全球化加速营结营!华为云赋能创业伙伴共拓海外市场
2024-07-20 20:25:18
华为张修征:今年上半年 CloudMatrix 384 超节点将有数万规模上线,有望“彻底终结算力焦虑”
2025-04-11 20:04:44
《雄狮少年2》背后的硬科技:全片渲染量超4亿核小时,每一拳都有真实“打击感”,赞奇&华为云支持
2024-12-27 09:55:34
独家|华为云:将加大对昇腾云、盘古大模型、数智融合等投入
2025-08-25 19:32:55
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
656 文章
307156 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29