10月28日,华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案,用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式,显存需求减半,硬件压力降低,同时相比INT8量化精度更高、数据范围更广,实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算,保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1,其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术:自研反量化算子、推理效率提升32%、主流模型无缝兼容,并全面支持DeepSeek V3.1等FP8量化模型,扩展性强,可快速适配新模型。
原文链接
本文链接:https://kx.umi6.com/article/27430.html
转载请注明文章出处
相关推荐
换一换
DeepSeek昨天悄悄扔的炸弹,今天爆了
2025-08-22 17:51:00
解决“佛跳墙、老婆饼”问题,联通开源首个完全在国产昇腾 AI 平台训练和推理的中文原生文生图模型“元景”
2025-01-08 18:40:41
DeepSeek 透露下一代国产芯片即将发布
2025-08-21 17:37:42
DeepSeek V3.1发布后,投资者该思考这四个问题
2025-08-21 09:26:48
性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片
2025-08-21 19:40:24
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
华为云新一代昇腾 AI 云服务全面上线:首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 全对等互联
2025-06-20 17:03:02
DeepSeek“点燃”国产芯片 FP8能否引领行业新标准?
2025-08-24 11:14:54
腾讯元宝接入 DeepSeek V3.1 最新版,电脑 / 网页版可体验
2025-08-22 16:51:05
实测DeepSeek V3.1,不止拓展上下文长度
2025-08-20 17:21:15
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
2025-09-29 09:04:51
“FP8 精度”如何赋能国产AI?
2025-09-01 22:24:04
DeepSeek V3.1 输出结果跳出“极”字 bug,官方回应了
2025-08-27 13:01:51
709 文章
637959 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41