华为通过“昇腾+Pangu Ultra MoE”组合,实现国产算力与模型全流程自主可控。该准万亿参数(7180亿)大模型仅需2秒即可解一道高数大题。团队采用智能并行优化、通信去冗余及全局负载均衡等技术,提升集群效率,实现41%的MFU。在后训练阶段,通过训推共卡技术和准异步机制,吞吐达35K Tokens/s,支持超4K卡集群扩展。此系统兼容MindSpeed、Megatron等框架,具备高泛化性和扩展性,标志着昇腾在超节点集群训练上的突破。
原文链接
本文链接:https://kx.umi6.com/article/19498.html
转载请注明文章出处
相关推荐
换一换
不整虚的!中美AI同步加速:47天30次更新,中国AI的最强主场究竟在哪?
2026-02-22 18:50:22
华为全球征集!悬赏300万元解决这两大技术难题
2025-12-26 17:56:26
百度推动大模型与搜推业务融合
2026-03-18 15:35:09
Kimi春节档挣超一年钱!这口“龙虾肉”大厂开始抢吃了
2026-02-26 01:05:27
上海已发布超150款备案大模型
2026-03-28 20:16:44
花3000元让AI改口,大模型的尽头是广告?
2026-01-06 19:29:29
华为新款AI眼镜由歌尔股份代工
2026-04-10 12:06:53
杭州“十五五”规划建议:实施大模型前沿技术攻关和高端芯片、基础软件、模型算法等研发计划 建设人工智能开源社区
2026-01-16 11:34:57
月之暗面 Kimi 创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到 K100
2026-01-12 09:22:11
智谱AI今日正式上市,一文讲透你想知道的6件事
2026-01-09 21:35:10
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
美团内测万亿级新一代大模型,全程基于国产算力集群训练
2026-04-24 12:12:33
刚刚,智谱港交所敲钟!市值528亿港元
2026-01-08 11:04:01
770 文章
686285 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41