5月7日消息,腾讯技术团队对DeepSeek开源的DeepEP通信框架进行了深度优化,大幅提升了其性能。优化后,在RoCE网络环境下性能提升100%,IB网络环境下提升30%。DeepEP专为专家混合(MoE)和专家并行(EP)设计,具备高吞吐量和低延迟特性,并支持FP8低精度运算。腾讯星脉网络团队通过解决双端口网卡带宽利用率低及CPU控制面交互时延两大问题实现了这一突破。优化成果已全面开源,并成功应用于腾讯混元大模型的训练推理中,展现了良好的通用性。DeepSeek对此表示公开致谢。
原文链接
本文链接:https://kx.umi6.com/article/18264.html
转载请注明文章出处
相关推荐
换一换
榨干每一块GPU,DeepSeek开源第二天,送上降本增效神器
2025-02-25 16:02:59
DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库
2025-02-25 12:00:43
DeepSeek开源第二弹,为MoE和EP量身定制的通信库!暂和英伟达显卡绑定
2025-02-25 11:49:28
DeepSeek 开源进度 2/5:首个用于 MoE 模型训练和推理的 EP 通信库 DeepEP
2025-02-25 11:53:00
DeepSeek扔的第二枚开源王炸到底是什么?
2025-02-25 20:07:11
华泰证券:DeepEP开源有望释放推理需求 关注应用与算力
2025-03-03 09:14:06
DeepSeek:预计下半年昇腾950超节点批量上市后 V4-Pro模型价格会大幅下调
2026-04-24 14:16:39
行业景气度高位运行 光模块企业扩产忙
2026-04-23 07:55:30
PPIO首批上线DeepSeek-V4预览版,1M超长上下文能力开箱即用
2026-04-24 17:23:07
英特尔CEO:CPU正重归AI核心地位
2026-04-24 11:08:56
成都出台人工智能产业人才九条 最高给予10亿元综合支持
2026-04-23 20:29:56
斑马智能接入支付宝AI付车载版 打通AI座舱“支付即服务”
2026-04-24 17:25:23
漫展误用AI元素 长虹电视道歉:立即下架重绘
2026-04-24 06:55:41
672 文章
530535 浏览
24小时热文
更多
-
2026-04-24 20:31:56 -
2026-04-24 20:29:51 -
2026-04-24 19:29:38