1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

3月17日,摩尔线程宣布开源两大AI框架MT-MegatronLM与MT-TransformerEngine。MT-MegatronLM支持dense、多模态及MoE模型的高效混合并行训练,而MT-TransformerEngine专注于Transformer模型的训练与推理优化。两大框架采用FP8混合训练策略和高性能算子库muDNN与MCCL,显著提升训练效率与稳定性。在全功能GPU集群上,Llama3 8B模型训练的MFU可达90%以上。此外,框架具备异常恢复机制、完整的生态兼容性及多种优化策略,如Dual Pipe并行策略和异步checkpoint。摩尔线程还计划引入更多功能,持续优化框架性能。开源地址已公布,助力开发者构建更强大的AI技术栈。

原文链接
本文链接:https://kx.umi6.com/article/15593.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里Qwen3问鼎开源王座!8款模型全面开放,最大杯全方位超越R1
2025-04-30 18:54:08
32B 稠密模型推理能力超越 R1?秘密 AI 团队发布推理小模型 AM-Thinking-v1
2025-05-16 14:53:48
百度文心大模型4.5系列正式开源 同步开放API服务
2025-06-30 11:47:18
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
大模型开源后如何投资AI? 顶级创投看好中国企业“换道超车”的机会
2025-08-01 13:02:40
全球首款AI 多人游戏来了,你的老电脑也能玩
2025-05-09 18:56:07
国产GPU历史性时刻!摩尔线程、沐曦同日获IPO受理
2025-07-01 16:26:02
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
2025-05-30 14:54:04
百度正式开源文心大模型 4.5 系列模型
2025-06-30 11:41:55
DeepSeek会在全球AI竞争中沉沦吗?
2025-06-03 14:57:13
马斯克宣布Grok-2正式开源 Grok-3也将在大概6个月内开源
2025-08-24 18:18:35
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
24小时热文
更多
扫一扫体验小程序