
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025世界人工智能大会(WAIC)将于7月26日至29日举行,华为将在本次大会上首次线下展出昇腾384超节点真机。该技术实现业界最大规模的384卡高速总线互联,备受关注。华为展区面积超800平方米,涵盖60多个展点,全面展示昇腾软硬件能力、训推解决方案及开源软件生态。此次亮相标志着华为在人工智能领域的技术实力进一步落地。(记者 黄心怡)
原文链接
今日,《科创板日报》报道,在华为开发者大会上,华为云计算CEO张平安宣布基于CloudMatrix384超节点的新一代昇腾AI云服务已正式上线。该服务将384颗昇腾NPU与192颗鲲鹏CPU通过高速网络MatrixLink全对等互联,构建起一台超级‘AI服务器’,单卡推理吞吐量达2300 Tokens/s。在云数据中心,最多可将432个超节点级联成高达16万卡的超大集群,并支持训推算力一体部署。此服务的推出将进一步提升大模型训练效率,适用于万亿、十万亿参数级别的复杂任务。记者黄心怡现场报道。
原文链接
6月20日,在华为开发者大会2025(HDC 2025)上,华为云宣布基于CloudMatrix384超节点的新一代昇腾AI云服务全面上线。该服务首次实现384颗昇腾NPU与192颗鲲鹏CPU全对等互联,形成超强“AI服务器”。单卡推理吞吐量达2300 Tokens/s,支持混合专家MoE大模型推理,一个超节点可支持384个专家并行推理,算力使用率提升50%以上。超节点还可级联至最高16万卡的超大集群,支持训推算力一体部署。目前,昇腾AI云服务已为1300多家客户提供算力支持,新浪、硅基流动、面壁智能等企业均采用该服务优化AI推理与训练。此外,中国科学院利用该技术构建AI for Science科研大模型,摆脱对外部平台依赖。
原文链接
标题:华为突破制裁的密码,藏在“384超节点”中
在通往通用人工智能(AGI)的路上,如何实现弯道超车是关键话题。单点技术虽飞速进步,但系统复杂度提升使性能瓶颈转向系统工程上限。如何在发挥单点优势的同时优化整体效能?华为近期推出的“昇腾 CloudMatrix 384超节点”提供了答案。
在...
原文链接
5月30日,华为推出参数规模达7180亿的盘古Ultra MoE模型,这是首个全流程在昇腾AI计算平台上训练的准万亿MoE模型。盘古团队采用Depth-Scaled Sandwich-Norm稳定架构及TinyInit小初始化方法,在昇腾平台上完成了超过18TB数据的长期稳定训练。华为首次在昇腾CloudMatrix 384超节点上实现大稀疏比MoE强化学习后训练框架,推动RL后训练进入超节点集群时代。基于5月初发布的预训练系统加速技术,华为团队通过多项技术创新,包括自适应流水掩盖策略、算子执行序优化、Host-Bound降低及EP通信掩盖提升、内存优化策略开发、数据重排实现DP间Attention负载均衡及昇腾亲和算子优化,使万卡集群预训练MFU从30%提升至41%。
原文链接
《科创板日报》30日消息,华为发布参数规模达7180亿的新模型——盘古Ultra MoE,该模型全流程基于昇腾AI计算平台训练。华为同步发布了盘古Ultra MoE的模型架构与训练方法技术报告。在训练方法上,华为首次在昇腾CloudMatrix 384超节点上实现大稀疏比MoE强化学习后训练框架,推动RL后训练进入超节点集群时代。此外,近期推出的盘古Pro MoE大模型(参数量720亿,激活160亿参数量)于2025年5月的大模型榜单SuperCLUE中,位列千亿参数量以内国内榜首。
原文链接
标题:每2秒破解一道高数难题!华为揭秘准万亿MoE昇腾训练系统全流程
正文:
现在,请大家数一下“1”、“2”。
短短2秒,一个准万亿MoE大模型已经学会解答一道高等数学难题!
更令人惊叹的是,这套系统全流程基于国产技术,不依赖GPU。
这就是华为通过“昇腾+Pangu Ultra Mo...
原文链接
华为通过“昇腾+Pangu Ultra MoE”组合,实现国产算力与模型全流程自主可控。该准万亿参数(7180亿)大模型仅需2秒即可解一道高数大题。团队采用智能并行优化、通信去冗余及全局负载均衡等技术,提升集群效率,实现41%的MFU。在后训练阶段,通过训推共卡技术和准异步机制,吞吐达35K Tokens/s,支持超4K卡集群扩展。此系统兼容MindSpeed、Megatron等框架,具备高泛化性和扩展性,标志着昇腾在超节点集群训练上的突破。
原文链接
鲲鹏昇腾开发者大会2025于5月23日在北京中关村国际创新中心举行,主题为‘心怀挚爱,共绽光芒’。大会发布了多项新技术与工具,包括鲲鹏AI+解决方案和openFuyao开源社区,旨在提升AI时代的算力效能。鲲鹏推出了多样化的算力集群软件,而昇腾则发布了CATLASS算子模板库、MindIE Motor推理服务加速库等,优化算子开发与模型训练效率。华为ICT Marketing部部长周军强调,鲲鹏、昇腾已吸引超过665万开发者与8800家合作伙伴,完成23900多个解决方案认证。此外,openFuyao开源项目聚焦云原生与AI,提供高效算力管理和调度能力。昇腾通过CANN分层开放、超节点架构及MindSpeed RL等工具,推动AI算力从底层到行业应用的全面革新。
原文链接
2025年5月23日,在鲲鹏昇腾开发者大会2025——昇腾AI开发者峰会上,华为推出昇腾超节点技术,成功实现业界最大规模的384卡高速总线互联。当前大模型发展面临参数与效率双重挑战,传统服务器跨机带宽成为训练瓶颈。华为创新提出对等计算架构,用高速总线替代以太网络,通信带宽提升15倍,时延降低10倍。昇腾384超节点由12个计算柜和4个总线柜组成,是目前业界规模最大的超节点,可扩展至数万卡的Atlas 900 SuperCluster集群。性能测试显示,LLaMA 3等模型性能提升2.5倍以上,Qwen、DeepSeek等复杂模型性能提升3倍以上,领先行业。
原文链接
加载更多

暂无内容