1月21日,摩尔线程与硅基流动联合宣布,在MTT S5000上利用FP8低精度推理技术完成对DeepSeek V3 671B大模型的深度适配与性能测试。实测单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,性能接近国际顶尖产品。这一成果展示了高性能推理技术的新突破,为大模型应用提供了更高效的硬件支持。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/32015.html
转载请注明文章出处
相关推荐
换一换
首个国产全功能GPU的万卡集群来了!“中国英伟达”出品
2024-07-04 20:43:24
DeepSeek甩出了一张“王炸”
2024-12-28 15:30:07
摩尔线程率先支持腾讯混元-A13B 模型,完成全功能 GPU 深度适配
2025-06-29 18:32:47
硅基流动完成新一轮亿元人民币融资 美团成战略股东
2025-02-19 20:59:33
爆火的DeepSeek-V3强在哪?
2024-12-29 15:55:20
英伟达中国一把手造国产GPU,冲刺IPO了
2025-06-19 17:51:43
省钱也是技术活:解密DeepSeek的极致压榨术
2025-01-23 16:22:07
阿里通义灵码新增支持 DeepSeek-V3 / R1 模型,降低 AI 编程门槛
2025-02-13 17:20:53
英伟达的最大空头出现了
2024-12-31 15:46:07
商汤大装置上架DeepSeek系列模型
2025-02-08 19:34:28
国产算力破局 摩尔线程打通端到端智驾仿真体系
2026-02-24 13:52:01
硅基流动 SiliconFlow 品牌焕新:启用新品牌视觉标识,国际站正式上线
2025-06-27 15:11:51
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
699 文章
522634 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18