1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

华为通过“昇腾+Pangu Ultra MoE”组合,实现国产算力与模型全流程自主可控。该准万亿参数(7180亿)大模型仅需2秒即可解一道高数大题。团队采用智能并行优化、通信去冗余及全局负载均衡等技术,提升集群效率,实现41%的MFU。在后训练阶段,通过训推共卡技术和准异步机制,吞吐达35K Tokens/s,支持超4K卡集群扩展。此系统兼容MindSpeed、Megatron等框架,具备高泛化性和扩展性,标志着昇腾在超节点集群训练上的突破。

原文链接
本文链接:https://kx.umi6.com/article/19498.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
华为新架构砍了Transformer大动脉!任意模型推理能力原地飙升
2025-12-06 02:03:09
全球首份大模型业绩报!MiniMax预判2026三大超级PMF,AI平台公司启程了
2026-03-03 11:54:49
豆包大模型2.0正式发布
2026-02-14 14:23:01
华为发布业界首个扩散语言模型Agent,部分场景提速8倍!
2026-02-10 16:22:31
中国AI云,开始「抢座次」了
2025-11-20 11:17:00
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
腾讯调整大模型组织架构:姚顺雨加盟,向总裁刘炽平汇报
2025-12-18 15:51:59
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
华为发布AI新技术:单卡同时承载多AI工作负载 提升硬件资源利用率
2025-11-21 16:31:21
消息称华为将发布 AI 领域突破性技术,有望解决算力资源利用效率难题
2025-11-16 15:38:04
百度新设两个大模型研发部:直接向CEO李彦宏汇报!
2025-11-25 22:10:22
海螺集团董事长杨军拜会任正非
2026-01-27 15:21:51
百度推动大模型与搜推业务融合
2026-03-18 15:35:09
24小时热文
更多
扫一扫体验小程序