9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/26078.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
华为云北方首批超节点 AI 智算中心开服
2025-07-12 22:56:36
华为云整体算力规模较去年同期增长率接近 250%,昇腾 AI 云服务客户从 321 家增长至 1714 家
2025-08-29 00:30:09
《黑神话》动捕供应商展示新算法:华科校友创办,华为云合作,亮相数博会
2024-09-04 00:44:39
华为云回应组织架构调整:将更多资源投入到AI产业和算力产业上
2025-08-25 17:33:58
华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了
2024-12-07 13:46:12
华为全联接大会2025:华为云以AI新引擎,重塑千行万业智能跃升
2025-09-19 11:11:41
最高300Pflops算力,超越”同行”67%!一文看懂华为云CloudMartix 384
2025-05-19 09:09:29
华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍
2025-09-19 13:12:27
华为云董理斌:大模型创新需围绕企业生产场景、核心场景展开
2024-07-06 05:42:11
DeepSeek V3 / R1 满血版上线华为云
2025-02-12 19:36:50
DeepSeek-V3.2-Exp API价格官宣大幅下调
2025-09-29 19:17:29
“清华系”面壁智能与华为云合作,推进大模型端云协同解决方案
2024-06-24 19:56:46
538 文章
228718 浏览
24小时热文
更多

-
2025-09-29 20:15:06
-
2025-09-29 20:14:51
-
2025-09-29 20:13:53