2月25日,DeepSeek在开源周上发布了DeepEP,首个用于MoE模型训练和推理的EP通信库。该库支持高效全对全通信及低精度运算,兼容现代高性能计算需求。特别优化了NVLink到RDMA的非对称带宽转发场景,提供高吞吐量和SM数量控制。对于延迟敏感的推理解码,DeepEP还提供纯RDMA低延迟内核,支持自适应路由,满足多样化GPU资源需求。
原文链接
本文链接:https://kx.umi6.com/article/14256.html
转载请注明文章出处
相关推荐
换一换
DeepSeek扔的第二枚开源王炸到底是什么?
2025-02-25 20:07:11
华泰证券:DeepEP开源有望释放推理需求 关注应用与算力
2025-03-03 09:14:06
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
一文详解:DeepSeek刚开源的DeepGEMM是怎么回事?
2025-02-26 14:36:20
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
美团发布并开源混合专家模型:5600亿参数 只激活5%就有奇效
2025-09-01 13:18:39
榨干每一块GPU,DeepSeek开源第二天,送上降本增效神器
2025-02-25 16:02:59
Deepseek-R1 等 AI 模型测试:英伟达 GB200 NVL72 性能较 HGX 200 提升 10 倍
2025-12-04 12:20:54
DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升
2025-05-07 20:17:50
DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP
2025-02-25 11:53:00
DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定
2025-02-25 11:49:28
智谱:暂时限量发售GLM Coding Plan
2026-01-21 14:13:51
微软CEO:AI时代的核心不是“单一模型” 而是“模型编排与算力工厂”
2026-01-21 17:23:41
665 文章
469846 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29