10月28日,华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案,用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式,显存需求减半,硬件压力降低,同时相比INT8量化精度更高、数据范围更广,实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算,保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1,其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术:自研反量化算子、推理效率提升32%、主流模型无缝兼容,并全面支持DeepSeek V3.1等FP8量化模型,扩展性强,可快速适配新模型。
原文链接
本文链接:https://kx.umi6.com/article/27430.html
转载请注明文章出处
相关推荐
换一换
股价逼近茅台,寒武纪还能走多远?
2025-08-28 11:21:08
DeepSeek V3.1更新「最终版」!下一次是V4/R2了???
2025-09-23 12:13:50
“FP8 精度”如何赋能国产AI?
2025-09-01 22:24:04
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
华为发布准万亿模型盘古Ultra MoE
2025-05-30 17:00:15
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
DeepSeek“极你太美”bug,官方回应了
2025-08-27 12:01:13
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025-08-27 13:01:51
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
2025-09-29 09:04:51
实测DeepSeek V3.1,不止拓展上下文长度
2025-08-20 17:21:15
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
672 文章
547694 浏览
24小时热文
更多
-
2026-04-24 13:15:05 -
2026-04-24 13:14:01 -
2026-04-24 13:12:56