9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/26078.html
转载请注明文章出处
相关推荐
换一换
DeepSeek-V3.2-Exp发布并开源
2025-09-29 18:14:47
《雄狮少年2》背后的硬科技:全片渲染量超4亿核小时,每一拳都有真实“打击感”,赞奇&华为云支持
2024-12-27 09:55:34
蚂蚁集团百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署
2025-10-18 20:38:01
盘古大模型5.0发布
2024-06-21 20:34:23
华为云创业全球化加速营结营!华为云赋能创业伙伴共拓海外市场
2024-07-20 20:25:18
九章云极率先完成DeepSeek-V3.2-Exp适配,提供安全高效部署方案
2025-09-30 16:29:13
云鼎科技与华为云举行化工工艺优化解决方案合作签约仪式
2024-12-07 20:54:13
华为云北方首批超节点 AI 智算中心开服
2025-07-12 22:56:36
华为云新一代昇腾 AI 云服务全面上线:首创将 384 颗昇腾 NPU 和 192 颗鲲鹏 CPU 全对等互联
2025-06-20 17:03:02
华为云发布全流程智能化 CodeArts Doer,支持多智能体协同
2025-06-20 18:04:14
华为云整体算力规模较去年同期增长率接近 250%,昇腾 AI 云服务客户从 321 家增长至 1714 家
2025-08-29 00:30:09
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
2025-09-29 21:16:07
华为云回应组织架构调整:将更多资源投入到AI产业和算力产业上
2025-08-25 17:33:58
609 文章
338906 浏览
24小时热文
更多
-
2025-12-08 17:39:25 -
2025-12-08 17:37:43 -
2025-12-08 16:38:29