DeepSeek新模型上线！引入DSA新稀疏注意力，还又狙了CUDA一枪

2025-09-29 19:13:01

元界筑梦师

发布在

快讯

阅读：1304

2025年9月29日，DeepSeek发布最新模型DeepSeek-V3.2-Exp，引入全新稀疏注意力机制DSA，显著提升长文本处理效率与推理性能。官方同步开源TileLang和CUDA双版本GPU算子，并推出API 5折优惠活动。新模型基于上周发布的V3.1-Terminus改进，在稳定性及工具调用能力上进一步优化，尤其在128K长上下文推理中成本更低。此外，智谱AI的GLM-4.6模型也在开发中，其官网已将GLM-4.5标记为‘上一代旗舰’。国庆期间将迎来一波AI技术更新热潮，开发者可关注相关资源链接获取更多信息。

原文链接

本文链接：https://kx.umi6.com/article/26079.html

转载请注明文章出处

DeepSeek