FP8 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

华为计算：KunLun AI Space 基于昇腾实现 DeepSeek V3.1 FP8 推理，成本减半

10月28日，华为计算宣布河南昆仑技术有限公司基于昇腾AI研发出软FP8解决方案，用于DeepSeek V3.1大模型推理。该方案采用FP8精度格式，显存需求减半，硬件压力降低，同时相比INT8量化精度更高、数据范围更广，实现“精度无损、成本减半”。通过反量化算子将FP8权重转化为BF16格式计算，保障准确性并提升适配灵活性。单台KunLun G8600可流畅运行满血版DeepSeek V3.1，其他机型也能实现参数规模翻倍和并发能力提升。方案具备三大核心技术：自研反量化算子、推理效率提升32%、主流模型无缝兼容，并全面支持DeepSeek V3.1等FP8量化模型，扩展性强，可快速适配新模型。

原文链接

AI思维矩阵

10-28 21:06:36

DeepSeek V3.1

FP8

昇腾AI

分享至

打开微信扫一扫

内容投诉

生成图片

“FP8 精度”如何赋能国产AI?

标题：“FP8 精度”如何赋能国产AI？正文：当前AI大模型训练与推理对算力需求巨大，而传统精度（如FP16/BF16）面临功耗、内存带宽和效率瓶颈。FP8（8位浮点数）作为一种新兴低精度格式，正成为下一代AI芯片的标配，并为国产AI芯片提供了技术追赶和参与制定未来计算标准的关键机遇。 ...

原文链接

超频思维站

09-01 22:24:04

AI芯片

FP8

内存墙

分享至

打开微信扫一扫

内容投诉

生成图片

股价逼近茅台，寒武纪还能走多远？

2025年8月，A股市场见证寒武纪股价飙升，22日涨停涨幅达20%，市值突破5200亿元，超越中芯国际成半导体行业龙头；25日再涨11.4%，市值逼近5800亿元，直追贵州茅台。此轮暴涨源于AI公司DeepSeek发布适配国产芯片的UE8M0 FP8技术，激发市场对国产算力未来的想象。然而，寒武纪市盈率高达4010倍，盈利能力尚不稳固，Q1净利润3.55亿元中有较大比例依赖非经常性损益，基本面存疑。同时，国内竞争激烈，国际CUDA生态壁垒高企，寒武纪突围之路挑战重重。资本市场对其寄予厚望，但千倍市盈与现实基本面的巨大落差，让其未来充满不确定性。

原文链接

跨界思维

08-28 11:21:08

CUDA

FP8

寒武纪

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek“点燃”国产芯片 FP8能否引领行业新标准？

8月24日，国产大模型企业DeepSeek宣布其新一代模型DeepSeek-V3.1采用FP8精度标准，专为下一代国产芯片设计，引发资本市场强烈反应，寒武纪等芯片企业股价上涨。然而，在2025算力大会上，业内人士态度审慎，认为FP8虽能提升算力效率、降低通信和存储需求，但存在计算出错风险，且需混合精度训练以平衡效率与准确性。专家指出，FP8代表算力优化方向，但实际落地效果及是否成为行业新标准仍待验证。此外，国产算力生态需同步升级，解决能耗、稳定性和集群利用等问题，单靠硬件堆砌难以满足需求，上下游厂商需联动优化。

原文链接

超频思维站

08-24 11:14:54

DeepSeek

FP8

国产芯片

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek V3到V3.1，走向国产算力自由

2025年8月，DeepSeek发布V3.1版本，迈出‘算力自由’关键一步。通过采用UE8M0 FP8参数精度，新版本大幅降低内存使用（最多减少75%），提升训练效率，并兼容国产芯片与MXFP8标准，推动国产AI生态发展。V3.1引入混合推理架构，支持思考与非思考模式，上下文长度达128k，性能提升且成本下降。此外，API新增strict模式和Anthropic API支持，强化企业服务能力。DeepSeek的创新路径包括榨取英伟达GPU潜力并适配国产芯片，逐步降低对进口高端GPU依赖。尽管短期内中国市场可能仍需英伟达H20/B30，但随着国产芯片与超低精度技术普及，长期需求将减弱。这一进展标志着中国AI芯片与模型生态迈向自主化的重要里程碑。

原文链接

智能涌动

08-24 09:10:38

UE8M0 FP8

国产芯片

算力自由

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek昨天悄悄扔的炸弹，今天爆了

8月21日，DeepSeek发布V3.1版本，引发资本市场强烈反响。A股市场超2800只个股上涨，算力和芯片板块全线爆发，寒武纪涨停创新高，中芯国际大涨14%。此次焦点是DeepSeek推出的“UE8M0 FP8”格式，一种基于MX格式的高效8位浮点存储技术，可显著提升国产芯片在大模型训练中的性能和效率。UE8M0通过简化硬件实现、降低带宽开销，为国产芯片突破内存墙提供了关键优化方案。这一技术不仅推动国产算力生态发展，也被视为中国芯片产业迈向国际前沿的重要信号。多家国产芯片厂商如寒武纪、摩尔线程已支持该格式，显示出全栈打通的技术实力。DeepSeek此举被解读为渐进式解绑英伟达依赖，助力国产芯片生态崛起。

原文链接

智能涌动

08-22 17:51:00

DeepSeek

FP8

UE8M0

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek一句话让国产芯片集体暴涨！背后的UE8M0 FP8到底是个啥

2025年8月22日，DeepSeek V3.1发布引发热议，其采用的UE8M0 FP8精度格式被指适配下一代国产芯片，带动国产芯片概念股集体上涨。寒武纪盘中大涨近14%，总市值超4940亿元，跃居科创板头名；半导体ETF半日涨5.89%。UE8M0 FP8是基于MXFP8格式的缩放因子优化方案，具备更高动态范围和更低带宽需求，被认为更适合国产AI加速器。多家厂商如寒武纪、华为昇腾等正布局FP8支持，预计2025年下半年起推出相关芯片。市场解读认为，这标志着国产AI软硬协同阶段的到来，减少对国外算力依赖，提升国产芯片性价比与竞争力。

原文链接

智慧棱镜

08-22 14:48:58

DeepSeek

UE8M0 FP8

国产芯片

分享至

打开微信扫一扫

内容投诉

生成图片

性能至少翻倍 DeepSeek官宣支持下一代国产AI芯片

2025年8月21日，DeepSeek发布v3.1版，整合思考与非思考模型，性能大幅提升，稳居开源大模型榜首。更引人注目的是，DeepSeek官宣支持下一代国产AI芯片，明确提到UE8M0 FP8格式，专为AI核心运算优化，性能至少翻倍，功耗仅为FP16的1/4，带宽需求更低。这一技术突破标志着国产AI芯片向更高精度和效率迈进。虽然未透露具体厂商，但暗示即将发布的芯片备受期待，进一步推动国产AI硬件发展。

原文链接

元界筑梦师

08-21 19:40:24

DeepSeek

FP8

国产AI芯片

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek 透露下一代国产芯片即将发布

8月21日，深度求索（DeepSeek）官方发布DeepSeek-V3.1模型，并透露下一代国产芯片即将推出。新芯片设计采用UE8M0 FP8标准，FP8是IEEE定义的浮点数类型，在AI模型中代表一种高精度计算能力。DeepSeek V3.1的Base模型在V3基础上新增840B tokens训练数据，相关模型已在Huggingface与魔搭平台开源。这一进展标志着国产AI芯片及模型研发迈向新阶段，引发行业关注。

原文链接

Oasis

08-21 17:37:42

DeepSeek-V3.1

FP8

国产芯片

分享至

打开微信扫一扫

内容投诉

生成图片

DeepSeek：UE8M0 FP8是针对即将发布的下一代国产芯片设计

2025年8月21日，DeepSeek在发布DeepSeek-V3.1的官方文章中透露，该版本采用了UE8M0 FP8 Scale参数精度，这一技术专为即将推出的下一代国产芯片设计。此外，DeepSeek-V3.1对分词器及chat template进行了显著优化，与前代DeepSeek-V3相比存在较大差异。这一消息由DeepSeek官微置顶留言确认，显示出其在模型性能和硬件适配上的创新突破。

原文链接

元界筑梦师

08-21 16:42:18

DeepSeek-V3.1

UE8M0 FP8

国产芯片

分享至

打开微信扫一扫

内容投诉

生成图片

加载更多