1月21日,摩尔线程与硅基流动联合宣布,在MTT S5000上利用FP8低精度推理技术完成对DeepSeek V3 671B大模型的深度适配与性能测试。实测单卡Prefill吞吐超4000 tokens/s,Decode吞吐超1000 tokens/s,性能接近国际顶尖产品。这一成果展示了高性能推理技术的新突破,为大模型应用提供了更高效的硬件支持。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/32015.html
转载请注明文章出处
相关推荐
换一换
DeepSeek-V3:美国芯片封锁的“意外”产物?
2025-01-06 10:21:20
摩尔线程新方法优化AI交互:显存节省最多82%
2025-03-04 19:31:51
免费的「网页版Cursor」!新版DeepSeek-V3加持,秒秒钟编出APP
2025-04-01 13:26:23
阿里通义灵码新增支持 DeepSeek-V3 / R1 模型,降低 AI 编程门槛
2025-02-13 17:20:53
中国黄仁勋来自美国英伟达
2026-01-08 20:36:00
摩尔线程发布Torch-MUSA v2.7.0 持续增强AI模型训练与推理支持
2025-11-28 11:28:30
投资界24h|Cursor获23亿美元D轮融资;源码资本募集6亿美元,周期25年;摩尔线程启动IPO发行,月底申购
2025-11-14 09:46:24
“中国版英伟达”闪电过会,从受理到过会仅用时88天
2025-09-28 13:54:28
摩尔线程及中介机构回复首轮审核问询函
2025-09-05 20:24:47
DeepSeek-V3横空出世,浙江私募力量震惊硅谷
2025-01-18 19:38:08
摩尔线程及中介机构回复第二轮审核问询函
2025-09-18 15:58:01
梁文锋等发表DeepSeek V3回顾性论文
2025-05-16 17:08:55
硅基流动助力华为小艺接入 DeepSeek-R1 模型
2025-02-08 00:09:00
764 文章
712544 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41