《科创板日报》30日消息,华为发布参数规模达7180亿的新模型——盘古Ultra MoE,该模型全流程基于昇腾AI计算平台训练。华为同步发布了盘古Ultra MoE的模型架构与训练方法技术报告。在训练方法上,华为首次在昇腾CloudMatrix 384超节点上实现大稀疏比MoE强化学习后训练框架,推动RL后训练进入超节点集群时代。此外,近期推出的盘古Pro MoE大模型(参数量720亿,激活160亿参数量)于2025年5月的大模型榜单SuperCLUE中,位列千亿参数量以内国内榜首。
原文链接
本文链接:https://kx.umi6.com/article/19522.html
转载请注明文章出处
相关推荐
换一换
华为开源 SINQ AI 量化技术:显存占用最高削减 70%,单张 RTX 4090 能干 A100 的活
2025-10-06 08:32:49
华为、浙大发布 DeepSeek-R1-Safe 基础大模型:基于昇腾千卡算力平台,破解 AI“安全与性能”难题
2025-09-21 12:44:49
华为刚投的物理AI:首家国产世界模型公司
2025-11-12 14:04:24
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
华为徐直军:全球最强超节点今年四季度上市
2025-09-18 10:51:41
白宫AI顾问警告:中国芯片设计仅落后美国1.5年 华为很快出口AI芯片
2026-04-13 18:11:59
金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案
2025-09-12 21:19:08
余承东亲自招人!华为招募全球顶尖AI人才:提供业内有竞争力的薪酬
2025-10-21 07:18:58
华为:将向开源欧拉社区贡献支持超节点的操作系统插件代码
2025-11-14 18:10:40
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
2025-07-10 23:28:33
黄仁勋:中国的AI市场无论有没有英伟达都会进步 与华为是竞争对手不是敌人
2025-07-21 05:12:10
华为预告重磅新品AI Data Platform!未来存储不叫数据存储了
2025-11-19 12:14:16
华为计算:KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理,成本减半
2025-10-28 21:06:36
713 文章
618771 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41