1月21日,摩尔线程与硅基流动联合宣布,在MTT S5000上利用FP8低精度推理技术完成对DeepSeek V3 671B大模型的深度适配与性能测试。实测单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,性能接近国际顶尖产品。这一成果展示了高性能推理技术的新突破,为大模型应用提供了更高效的硬件支持。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/32015.html
转载请注明文章出处
相关推荐
换一换
国产GPU第一股诞生!摩尔线程正式登陆科创板
2025-12-05 11:26:22
“DeepSeek-V3基于我们的架构打造”,欧版OpenAI CEO逆天发言被喷了
2026-01-26 13:08:15
国产算力破局 摩尔线程打通端到端智驾仿真体系
2026-02-24 13:52:01
摩尔线程 MTT S4000 训推一体计算卡通过中国信通院 AI 芯片和大模型适配验证
2025-05-08 10:25:57
大模型性价比之王来了!训练2个月、花费558万美元 性能匹敌GPT-4o
2024-12-27 14:07:00
商汤大装置上架DeepSeek系列模型
2025-02-08 19:34:28
DeepSeek预示算力需求“打骨折”?业界:别只盯着训练 AI行业进入推理时代
2024-12-30 09:15:53
中国黄仁勋来自美国英伟达
2026-01-08 20:36:00
AMD:已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上
2025-01-25 18:04:42
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
2025-08-25 21:34:29
省钱也是技术活:解密DeepSeek的极致压榨术
2025-01-23 16:22:07
“中国英伟达”投资人,赚翻了
2025-09-26 17:32:45
抢下120亿,这届芯片老兵要翻身了
2025-07-09 18:08:01
730 文章
615898 浏览
24小时热文
更多
-
2026-04-24 08:00:05 -
2026-04-24 06:56:46 -
2026-04-24 06:55:41