2月25日,DeepSeek在开源周上发布了DeepEP,首个用于MoE模型训练和推理的EP通信库。该库支持高效全对全通信及低精度运算,兼容现代高性能计算需求。特别优化了NVLink到RDMA的非对称带宽转发场景,提供高吞吐量和SM数量控制。对于延迟敏感的推理解码,DeepEP还提供纯RDMA低延迟内核,支持自适应路由,满足多样化GPU资源需求。
原文链接
本文链接:https://kx.umi6.com/article/14256.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek扔的第二枚开源王炸到底是什么?
2025-02-25 20:07:11
美团发布并开源混合专家模型:5600亿参数 只激活5%就有奇效
2025-09-01 13:18:39
一文详解:DeepSeek刚开源的DeepGEMM是怎么回事?
2025-02-26 14:36:20
DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP
2025-02-25 11:53:00
DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定
2025-02-25 11:49:28
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升
2025-05-07 20:17:50
华泰证券:DeepEP开源有望释放推理需求 关注应用与算力
2025-03-03 09:14:06
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
榨干每一块GPU,DeepSeek开源第二天,送上降本增效神器
2025-02-25 16:02:59
“超级周期”持续演绎 三星和SK海力士将内存价格上调30%
2025-10-23 13:08:10
《GTA6》电臀舞玩法被辟谣:网友瞎编的 结果谷歌AI全信了
2025-10-22 18:52:05
字节Seed团队推出3D生成大模型Seed3D 1.0
2025-10-23 16:12:12
569 文章
299928 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07