3月17日,摩尔线程宣布开源两大AI框架MT-MegatronLM与MT-TransformerEngine。MT-MegatronLM支持dense、多模态及MoE模型的高效混合并行训练,而MT-TransformerEngine专注于Transformer模型的训练与推理优化。两大框架采用FP8混合训练策略和高性能算子库muDNN与MCCL,显著提升训练效率与稳定性。在全功能GPU集群上,Llama3 8B模型训练的MFU可达90%以上。此外,框架具备异常恢复机制、完整的生态兼容性及多种优化策略,如Dual Pipe并行策略和异步checkpoint。摩尔线程还计划引入更多功能,持续优化框架性能。开源地址已公布,助力开发者构建更强大的AI技术栈。
原文链接
本文链接:https://kx.umi6.com/article/15593.html
转载请注明文章出处
相关推荐
换一换
投资界24h|Cursor获23亿美元D轮融资;源码资本募集6亿美元,周期25年;摩尔线程启动IPO发行,月底申购
2025-11-14 09:46:24
摩尔线程科创板IPO上会在即 联美控股收盘三连板 十余家上市公司互动易回复参股投资
2025-09-25 15:07:35
阿里通义深夜炸场:全球首个端到端全模态 AI 模型 Qwen3-Omni 发布开源,文本、图像、音视频全统一
2025-09-23 10:12:45
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
AI“以小博大”新标杆:三星开源 TRM 模型,700 万参数、特定任务性能媲美 Deepseek R1 等万倍大模型
2025-10-11 10:06:15
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
钉钉CLI开源!首批开放10项核心产品能力,原生支持ClaudeCode等
2026-03-27 20:17:17
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
小米语音首席科学家:AI发展的本质就像生物进化,不开源要慢1000倍 | MEET2026
2025-12-16 09:28:45
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
684 文章
577167 浏览
24小时热文
更多
-
2026-05-10 12:05:34 -
2026-05-09 21:38:59 -
2026-05-09 21:35:54