2月25日,DeepSeek在开源周上发布了DeepEP,首个用于MoE模型训练和推理的EP通信库。该库支持高效全对全通信及低精度运算,兼容现代高性能计算需求。特别优化了NVLink到RDMA的非对称带宽转发场景,提供高吞吐量和SM数量控制。对于延迟敏感的推理解码,DeepEP还提供纯RDMA低延迟内核,支持自适应路由,满足多样化GPU资源需求。
原文链接
本文链接:https://kx.umi6.com/article/14256.html
转载请注明文章出处
相关推荐
.png)
换一换
月之暗面开源Moonlight:30亿/160亿参数混合专家模型
2025-02-24 09:20:48
DeepSeek扔的第二枚开源王炸到底是什么?
2025-02-25 20:07:11
榨干每一块GPU,DeepSeek开源第二天,送上降本增效神器
2025-02-25 16:02:59
459 文章
83788 浏览
24小时热文
更多

-
2025-07-20 10:03:13
-
2025-07-20 10:02:01
-
2025-07-20 09:01:50