1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:字节开源COMET,大幅降低MoE训练成本

正文: 字节开源了名为COMET的MoE优化技术,已应用于其万卡训练集群,累计节省数百万GPU小时。COMET可将MoE模型训练成本降低40%。

COMET针对MoE模型在分布式训练中的通信开销问题,通过细粒度计算-通信折叠技术和动态资源分配,提升了训练效率。在大规模MoE模型的单个执行层上,COMET可提速1.96倍,端到端平均提速1.71倍。

COMET通过共享张量依赖解析和自适应负载分配,解决了计算与通信的粒度不匹配问题。它还支持业界主流大模型,无需复杂改动即可部署。COMET在多个大规模MoE模型中表现出色,端到端性能提升31.8%-44.4%。

目前,COMET核心代码已开源,包括约1.2万行C++和CUDA代码,以及2千行Python代码,并提供Python API。

原文链接
本文链接:https://kx.umi6.com/article/15231.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
2025-03-10 18:50:46
Mythos架构被22岁小伙“逆推”开源了!MoE和注意力借鉴DeepSeek
2026-04-20 16:12:29
训练MoE足足提速70%!华为只用了3招
2025-06-03 15:58:16
“全球首创”单台 RTX 4090 服务器推理,昆仑万维开源 2 千亿稀疏大模型天工 MoE
2024-06-03 18:55:11
AI如何改变通信?对话联想懂的通信
2024-06-29 15:42:54
对话中国工程院院士郑纬民:DeepSeek,究竟厉害在哪里
2025-01-27 12:28:38
榨干每一块GPU,DeepSeek开源第二天,送上降本增效神器
2025-02-25 16:02:59
OpenAI突然开源新模型!99.9%的权重是0,新稀疏性方法代替MoE
2025-12-14 14:46:00
竞购Chrome的Perplexity,为什么要做AI浏览器?
2025-08-16 09:23:59
MoE 高效训练的 A/B 面:与魔鬼做交易,用「显存」换「性能」
2024-06-07 18:18:13
腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型
2024-11-05 17:04:28
DeepSeek前实习生魔改MoE,用迭代机制把内存需求砍了42%,团队:“免费午餐”优化方法
2025-03-08 11:43:54
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
2025-05-30 16:54:34
24小时热文
更多
扫一扫体验小程序