6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
本文链接:https://kx.umi6.com/article/20538.html
转载请注明文章出处
相关推荐
换一换
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
《雄狮少年2》背后的硬科技:全片渲染量超4亿核小时,每一拳都有真实“打击感”,赞奇&华为云支持
2024-12-27 09:55:34
华为张修征:今年上半年 CloudMatrix 384 超节点将有数万规模上线,有望“彻底终结算力焦虑”
2025-04-11 20:04:44
华为云CloudMatrix384超节点AI Token服务全面上线
2025-09-19 11:16:25
国家数据局局长刘烈宏调研华为云上屯数据中心、贵州数据宝网络科技有限公司
2025-08-28 21:29:50
独家|华为联合软通动力、道和通泰等探索具身智能落地
2025-06-23 10:30:40
蚂蚁集团百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署
2025-10-18 20:38:01
爱尔眼科与华为云签署战略合作协议
2025-06-28 21:23:34
华为云基于CloudMatrix384的昇腾AI云服务正式上线
2025-06-20 17:10:26
曝华为云架构调整:裁撤整合多个部门 专注AI领域 目标今年盈利
2025-08-23 16:02:39
华为发布准万亿模型盘古Ultra MoE
2025-05-30 17:00:15
华为云创业全球化加速营结营!华为云赋能创业伙伴共拓海外市场
2024-07-20 20:25:18
对话华为云CTO张宇昕:互联网是应用大模型的冲锋军?我们都想错了
2024-12-27 18:08:36
822 文章
640510 浏览
24小时热文
更多
-
2026-04-24 16:19:57 -
2026-04-24 15:20:44 -
2026-04-24 15:19:39