标题:DeepSeek公布545%成本利润率
DeepSeek最新发布的DeepSeek-V3/R1推理系统揭示了优化吞吐量和延迟的方法,包括跨节点EP驱动的批量扩展、计算与通信重叠及负载均衡。该系统每个H800节点每秒处理73.7k/14.8k个输入/输出token,成本利润率高达545%。
通过大规模跨节点专家并行(EP),DeepSeek提高了吞吐量并降低了延迟。EP使批处理大小增加,减少了延迟,但也引入了跨节点传输和负载均衡的问题。系统采用双batch重叠技术来掩盖通信开销,提高整体吞吐量。此外,还实现了Prefill和Decode阶段的负载均衡,确保每个GPU的计算和通信负载均衡。
DeepSeekV3和R1服务使用H800 GPU,24小时内峰值占用278个节点,平均226.75个节点。系统在高峰时段全节点运行,在低谷时段减少节点用于研究和训练。24小时内,系统处理了608B输入token,其中56.3%命中KVCache,输出168B token,平均输出速率为20~22tps。平均每台H800的吞吐量为73.7k输入token/s(含缓存命中)和14.8k输出token/s。若按DeepSeek R1的定价计算,理论日收入为$562,027,实际成本利润率为545%。
原文链接
本文链接:https://kx.umi6.com/article/14580.html
转载请注明文章出处
相关推荐
换一换
DeepSeek突袭公布成本利润率:545%
2025-03-01 14:57:43
官方详解 DeepSeek-V3 / R1 推理系统:优化目标是更大吞吐、更低延迟
2025-03-01 13:58:32
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!
2025-05-20 14:38:41
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
周鸿祎解读AI短剧:直言有望颠覆Netflix 生产效率提升数十倍
2026-03-08 14:07:20
李开复谈OpenClaw:今年是“企业多智能体上岗”元年
2026-03-06 15:13:08
全国人大代表张帆:建议研究出台加强工业数据集建设的财税支持政策
2026-03-06 19:29:19
暴雪皮克斯老兵的AI社交实验:用声音匹配,MAU破260万,估值1.5亿美金
2026-03-09 13:39:33
AI将胜任80%岗位!亿万富翁:如今5岁儿童成年后将无需再为生存而工作
2026-03-06 15:12:02
苏州人工智能专项母基金等成立投资合伙企业 出资额5亿
2026-03-06 17:22:54
最高法:打击滥用AI换脸等行为 斩断为电诈提供“技术助攻”的链条
2026-03-09 15:54:50
阿里AI办事发展速度快于亚马逊及OpenAI
2026-03-07 16:46:47
国家发展改革委主任:“十五五”末人工智能相关产业规模将增长到10万亿元以上
2026-03-06 16:15:23
737 文章
512889 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18