9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/26078.html
转载请注明文章出处
相关推荐
换一换
谁在重新定义 AI 云?
2025-09-19 14:13:12
华为云发布全流程智能化 CodeArts Doer,支持多智能体协同
2025-06-20 18:04:14
蚂蚁集团百灵万亿参数模型「Ling-1T」上架华为云,支持专属资源部署
2025-10-18 20:38:01
云鼎科技与华为云举行化工工艺优化解决方案合作签约仪式
2024-12-07 20:54:13
华为云CEO周跃峰:公有云用AI已成行业主流
2026-03-20 15:41:53
华为云OpenClaw体验计划上线
2026-03-11 21:39:14
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
智谱GLM-5.1“Day0”上线华为云,可通过多款产品体验
2026-04-08 19:02:52
华为云发布CloudMatrix 384超节点 已通过昇腾云正式商用
2025-04-14 17:41:08
爱尔眼科与华为云签署战略合作协议
2025-06-28 21:23:34
华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍
2025-09-19 13:12:27
DeepSeek-V3.2-Exp第一时间上线华为云
2025-09-30 00:16:10
硅基流动 x 华为云推出基于昇腾云的 DeepSeek R1&V3 推理服务
2025-02-01 14:23:57
765 文章
651141 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41