10月28日,华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案,用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式,显存需求减半,硬件压力降低,同时相比INT8量化精度更高、数据范围更广,实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算,保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1,其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术:自研反量化算子、推理效率提升32%、主流模型无缝兼容,并全面支持DeepSeek V3.1等FP8量化模型,扩展性强,可快速适配新模型。
原文链接
本文链接:https://kx.umi6.com/article/27430.html
转载请注明文章出处
相关推荐
换一换
华为云新一代昇腾 AI 云服务全面上线:首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 全对等互联
2025-06-20 17:03:02
“FP8 精度”如何赋能国产AI?
2025-09-01 22:24:04
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
DeepSeek 透露下一代国产芯片即将发布
2025-08-21 17:37:42
DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4
2025-08-21 10:27:32
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
华为计算:KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理,成本减半
2025-10-28 21:06:36
华为发布准万亿模型盘古Ultra MoE
2025-05-30 17:00:15
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025-08-27 13:01:51
股价逼近茅台,寒武纪还能走多远?
2025-08-28 11:21:08
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
525 文章
254702 浏览
24小时热文
更多
-
2025-10-29 04:28:00 -
2025-10-29 03:24:46 -
2025-10-29 02:22:31