6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
本文链接:https://kx.umi6.com/article/20538.html
转载请注明文章出处
相关推荐
换一换
华为云回应组织架构调整:将更多资源投入到AI产业和算力产业上
2025-08-25 17:33:58
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
华为云北方首批超节点 AI 智算中心开服
2025-07-12 22:56:36
华为云新一代昇腾 AI 云服务全面上线:首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 全对等互联
2025-06-20 17:03:02
蚂蚁集团百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署
2025-10-18 20:38:01
最高300Pflops算力,超越”同行”67%!一文看懂华为云CloudMartix 384
2025-05-19 09:09:29
华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍
2025-09-19 13:12:27
华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了
2024-12-07 13:46:12
华为全联接大会2025:华为云以AI新引擎,重塑千行万业智能跃升
2025-09-19 11:11:41
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
华为云发布盘古大模型 5.5:自然语言处理等五大基础模型全面升级
2025-06-20 17:03:08
云鼎科技与华为云举行化工工艺优化解决方案合作签约仪式
2024-12-07 20:54:13
翰宇药业:与华为云签署全面合作协议 聚焦“AI智药”
2025-04-28 09:51:42
702 文章
402775 浏览
24小时热文
更多
-
2025-12-08 23:53:52 -
2025-12-08 22:52:38 -
2025-12-08 22:51:57