9月29日,DeepSeek-V3.2-Exp模型在Hugging Face平台正式发布并开源。该模型采用稀疏Attention架构,显著降低计算资源消耗,同时提升推理效率。目前,华为云已完成对该模型的适配,支持最大160K长序列上下文长度。这一进展为大模型应用提供了更高性能和灵活性。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/26078.html
转载请注明文章出处
相关推荐
换一换
国家数据局局长刘烈宏调研华为云上屯数据中心、贵州数据宝网络科技有限公司
2025-08-28 21:29:50
盘古大模型5.0发布
2024-06-21 20:34:23
华为全联接大会2025:华为云以AI新引擎,重塑千行万业智能跃升
2025-09-19 11:11:41
华为云发布全流程智能化 CodeArts Doer,支持多智能体协同
2025-06-20 18:04:14
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
DeepSeek-V3.2-Exp API价格官宣大幅下调
2025-09-29 19:17:29
DeepSeek新发布
2025-09-29 22:15:21
华为云:做厚算力“黑土地”,成就行业AI先锋
2025-09-22 08:54:15
寒武纪Day 0适配DeepSeek-V3.2-Exp 同步开源推理引擎vLLM-MLU
2025-09-29 21:16:07
DeepSeek-V3.2-Exp官宣发布,API价格下调超50%
2025-09-29 20:15:06
爱尔眼科与华为云签署战略合作协议
2025-06-28 21:23:34
华为云又一数据中心开服:让算力像水电一样通用,青岛这步棋走对了
2024-12-07 13:46:12
华为云CloudMatrix384超节点AI Token服务全面上线
2025-09-19 11:16:25
660 文章
412213 浏览
24小时热文
更多
-
2026-01-22 21:11:56 -
2026-01-22 20:08:53 -
2026-01-22 19:09:39