1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:DeepSeek公布545%成本利润率

DeepSeek最新发布的DeepSeek-V3/R1推理系统揭示了优化吞吐量和延迟的方法,包括跨节点EP驱动的批量扩展、计算与通信重叠及负载均衡。该系统每个H800节点每秒处理73.7k/14.8k个输入/输出token,成本利润率高达545%。

通过大规模跨节点专家并行(EP),DeepSeek提高了吞吐量并降低了延迟。EP使批处理大小增加,减少了延迟,但也引入了跨节点传输和负载均衡的问题。系统采用双batch重叠技术来掩盖通信开销,提高整体吞吐量。此外,还实现了Prefill和Decode阶段的负载均衡,确保每个GPU的计算和通信负载均衡。

DeepSeekV3和R1服务使用H800 GPU,24小时内峰值占用278个节点,平均226.75个节点。系统在高峰时段全节点运行,在低谷时段减少节点用于研究和训练。24小时内,系统处理了608B输入token,其中56.3%命中KVCache,输出168B token,平均输出速率为20~22tps。平均每台H800的吞吐量为73.7k输入token/s(含缓存命中)和14.8k输出token/s。若按DeepSeek R1的定价计算,理论日收入为$562,027,实际成本利润率为545%。

原文链接
本文链接:https://kx.umi6.com/article/14580.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
官方详解 DeepSeek-V3 / R1 推理系统:优化目标是更大吞吐、更低延迟
2025-03-01 13:58:32
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
2025-05-20 14:38:41
DeepSeek突袭公布成本利润率:545%
2025-03-01 14:57:43
24小时热文
更多
扫一扫体验小程序