华为 + DeepSeek 推理性能创新高，技术报告公布

2025-05-19 14:19:50

小阳哥

发布在

快讯

阅读：1537

华为昇腾在推理DeepSeek V3/R1模型上的性能创新高，单卡decode吞吐达1920 Tokens/s，全面超越英伟达Hopper架构。华为通过‘以数学补物理’的方法，优化硬件与算法，解决超大规模MoE模型的内存压力、通信开销及架构复杂性等问题。昇腾推出了CloudMatrix 384超节点和Atlas 800I A2服务器，分别实现50ms和100ms时延下的高效推理。团队还开源了相关技术报告与代码，推动大模型推理技术进步。此外，华为将于近期举办技术披露周，更多信息可关注相关链接。此成果于2025年4月正式上线，助力商业应用抢占先机。

原文链接

本文链接：https://kx.umi6.com/article/18815.html

转载请注明文章出处

DeepSeek