
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
华为CloudMatrix重磅论文披露AI数据中心新范式,推理效率超H100。今年,AI大厂对GPU的投入持续加码,但单纯堆卡并非最优解。传统AI集群面临通信瓶颈、内存碎片化等问题,难以充分发挥性能。华为发布60页论文,提出下一代AI数据中心架构——CloudMatrix,以及第一代产品CloudM...
原文链接
今日,《科创板日报》报道,在华为开发者大会上,华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务已正式上线。该服务将384颗昇腾NPU与192颗鲲鹏CPU通过高速网络MatrixLink全对等互联,构建起一台超级‘AI服务器’,单卡推理吞吐量达2300 Tokens/s。在云数据中心,最多可将432个超节点级联成高达16万卡的超大集群,并支持训推算力一体部署。此服务的推出将进一步提升大模型训练效率,适用于万亿、十万亿参数级别的复杂任务。记者黄心怡现场报道。
原文链接
6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
标题:华为突破制裁的密码,藏在“384超节点”中
在通往通用人工智能(AGI)的路上,如何实现弯道超车是关键话题。单点技术虽飞速进步,但系统复杂度提升使性能瓶颈转向系统工程上限。如何在发挥单点优势的同时优化整体效能?华为近期推出的“昇腾 CloudMatrix 384超节点”提供了答案。
在...
原文链接
华为云黄瑾:昇腾云CloudMatrix 384超节点定义下一代AI基础设施
5月16日,华为云AI峰会在京召开,华为云副总裁黄瑾发表主题演讲,详解CloudMatrix 384超节点的技术优势。他指出,大模型训练和推理对算力的需求呈爆炸式增长,传统架构难以满足AI技术的发展。CloudMatr...
原文链接
标题:最高300Pflops算力,领先同行67%!华为云CloudMatrix 384解析
华为云近日发布CloudMatrix 384超节点,采用全对等互联架构,可实现384张卡互联成一超级云服务器,提供最高300Pflops算力,比业内同类产品领先67%。在“逐光向新·智领未来”华为云AI峰...
原文链接
4月10日,华为云在安徽芜湖举办的生态大会上发布CloudMatrix 384超节点,并宣布已在芜湖数据中心规模上线。该超节点基于“一切可池化、一切皆对等、一切可组合”的创新架构,具备高密、高速、高效的特点,在算力、互联带宽、内存带宽等方面表现突出。华为云CEO张平安强调,CloudMatrix 384旨在加速行业智能化,通过昇腾AI云服务和盘古大模型助力各行业AI应用快速开发与落地。目前,昇腾AI云服务已适配160多个第三方大模型,赋能行业应用。此外,华为云持续深化行业解决方案,与合作伙伴共建生态,开发者规模已达1200万,伙伴数量超4.5万,共同推动千行万业智能化转型。
原文链接
4月11日消息,华为公司副总裁张修征透露,华为云CloudMatrix 384超节点今年上半年将上线数万规模,有望解决算力焦虑问题。此超节点可构建超万片大集群,提供强大算力支持。CloudMatrix 384具备“高密”“高速”“高效”特点,在算力、互联带宽、内存带宽等方面表现领先。华为云还优化了昇腾AI云服务,适配160多个第三方大模型,助力行业应用落地。目前,盘古大模型已在30多行业、400多场景中应用,涵盖城市治理、智慧金融等领域。硅基流动联合华为云基于CloudMatrix 384超节点上线DeepSeek-R1,单卡Decode吞吐达1920 Tokens/s,模型精度与官方一致。
原文链接
加载更多

暂无内容