10月28日,华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案,用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式,显存需求减半,硬件压力降低,同时相比INT8量化精度更高、数据范围更广,实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算,保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1,其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术:自研反量化算子、推理效率提升32%、主流模型无缝兼容,并全面支持DeepSeek V3.1等FP8量化模型,扩展性强,可快速适配新模型。
原文链接
本文链接:https://kx.umi6.com/article/27430.html
转载请注明文章出处
相关推荐
换一换
DeepSeek 透露下一代国产芯片即将发布
2025-08-21 17:37:42
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025-08-27 13:01:51
DeepSeek V3.1更新「最终版」!下一次是V4/R2了???
2025-09-23 12:13:50
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
2025-09-29 09:04:51
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
腾讯元宝接入 DeepSeek V3.1 最新版,电脑 / 网页版可体验
2025-08-22 16:51:05
“FP8 精度”如何赋能国产AI?
2025-09-01 22:24:04
解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”
2025-01-08 18:40:41
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
华为计算:KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理,成本减半
2025-10-28 21:06:36
DeepSeek“极你太美”bug,官方回应了
2025-08-27 12:01:13
643 文章
463392 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18