
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:“FP8 精度”如何赋能国产AI?
正文:
当前AI大模型训练与推理对算力需求巨大,而传统精度(如FP16/BF16)面临功耗、内存带宽和效率瓶颈。FP8(8位浮点数)作为一种新兴低精度格式,正成为下一代AI芯片的标配,并为国产AI芯片提供了技术追赶和参与制定未来计算标准的关键机遇。
...
原文链接
2025年8月,A股市场见证寒武纪股价飙升,22日涨停涨幅达20%,市值突破5200亿元,超越中芯国际成半导体行业龙头;25日再涨11.4%,市值逼近5800亿元,直追贵州茅台。此轮暴涨源于AI公司DeepSeek发布适配国产芯片的UE8M0 FP8技术,激发市场对国产算力未来的想象。然而,寒武纪市盈率高达4010倍,盈利能力尚不稳固,Q1净利润3.55亿元中有较大比例依赖非经常性损益,基本面存疑。同时,国内竞争激烈,国际CUDA生态壁垒高企,寒武纪突围之路挑战重重。资本市场对其寄予厚望,但千倍市盈与现实基本面的巨大落差,让其未来充满不确定性。
原文链接
8月24日,国产大模型企业DeepSeek宣布其新一代模型DeepSeek-V3.1采用FP8精度标准,专为下一代国产芯片设计,引发资本市场强烈反应,寒武纪等芯片企业股价上涨。然而,在2025算力大会上,业内人士态度审慎,认为FP8虽能提升算力效率、降低通信和存储需求,但存在计算出错风险,且需混合精度训练以平衡效率与准确性。专家指出,FP8代表算力优化方向,但实际落地效果及是否成为行业新标准仍待验证。此外,国产算力生态需同步升级,解决能耗、稳定性和集群利用等问题,单靠硬件堆砌难以满足需求,上下游厂商需联动优化。
原文链接
2025年8月,DeepSeek发布V3.1版本,迈出‘算力自由’关键一步。通过采用UE8M0 FP8参数精度,新版本大幅降低内存使用(最多减少75%),提升训练效率,并兼容国产芯片与MXFP8标准,推动国产AI生态发展。V3.1引入混合推理架构,支持思考与非思考模式,上下文长度达128k,性能提升且成本下降。此外,API新增strict模式和Anthropic API支持,强化企业服务能力。DeepSeek的创新路径包括榨取英伟达GPU潜力并适配国产芯片,逐步降低对进口高端GPU依赖。尽管短期内中国市场可能仍需英伟达H20/B30,但随着国产芯片与超低精度技术普及,长期需求将减弱。这一进展标志着中国AI芯片与模型生态迈向自主化的重要里程碑。
原文链接
8月21日,DeepSeek发布V3.1版本,引发资本市场强烈反响。A股市场超2800只个股上涨,算力和芯片板块全线爆发,寒武纪涨停创新高,中芯国际大涨14%。此次焦点是DeepSeek推出的“UE8M0 FP8”格式,一种基于MX格式的高效8位浮点存储技术,可显著提升国产芯片在大模型训练中的性能和效率。UE8M0通过简化硬件实现、降低带宽开销,为国产芯片突破内存墙提供了关键优化方案。这一技术不仅推动国产算力生态发展,也被视为中国芯片产业迈向国际前沿的重要信号。多家国产芯片厂商如寒武纪、摩尔线程已支持该格式,显示出全栈打通的技术实力。DeepSeek此举被解读为渐进式解绑英伟达依赖,助力国产芯片生态崛起。
原文链接
2025年8月22日,DeepSeek V3.1发布引发热议,其采用的UE8M0 FP8精度格式被指适配下一代国产芯片,带动国产芯片概念股集体上涨。寒武纪盘中大涨近14%,总市值超4940亿元,跃居科创板头名;半导体ETF半日涨5.89%。UE8M0 FP8是基于MXFP8格式的缩放因子优化方案,具备更高动态范围和更低带宽需求,被认为更适合国产AI加速器。多家厂商如寒武纪、华为昇腾等正布局FP8支持,预计2025年下半年起推出相关芯片。市场解读认为,这标志着国产AI软硬协同阶段的到来,减少对国外算力依赖,提升国产芯片性价比与竞争力。
原文链接
2025年8月21日,DeepSeek发布v3.1版,整合思考与非思考模型,性能大幅提升,稳居开源大模型榜首。更引人注目的是,DeepSeek官宣支持下一代国产AI芯片,明确提到UE8M0 FP8格式,专为AI核心运算优化,性能至少翻倍,功耗仅为FP16的1/4,带宽需求更低。这一技术突破标志着国产AI芯片向更高精度和效率迈进。虽然未透露具体厂商,但暗示即将发布的芯片备受期待,进一步推动国产AI硬件发展。
原文链接
8月21日,深度求索(DeepSeek)官方发布DeepSeek-V3.1模型,并透露下一代国产芯片即将推出。新芯片设计采用UE8M0 FP8标准,FP8是IEEE定义的浮点数类型,在AI模型中代表一种高精度计算能力。DeepSeek V3.1的Base模型在V3基础上新增840B tokens训练数据,相关模型已在Huggingface与魔搭平台开源。这一进展标志着国产AI芯片及模型研发迈向新阶段,引发行业关注。
原文链接
2025年8月21日,DeepSeek在发布DeepSeek-V3.1的官方文章中透露,该版本采用了UE8M0 FP8 Scale参数精度,这一技术专为即将推出的下一代国产芯片设计。此外,DeepSeek-V3.1对分词器及chat template进行了显著优化,与前代DeepSeek-V3相比存在较大差异。这一消息由DeepSeek官微置顶留言确认,显示出其在模型性能和硬件适配上的创新突破。
原文链接
加载更多

暂无内容