梁文锋参与著作！DeepSeek最新论文介绍新机制可使AI模型进一步降本增效

2025-02-18 21:29:43

LunarCoder

发布在

快讯

阅读：297

2月18日，DeepSeek团队发布论文介绍新机制NSA（Natively Sparse Attention），专为长文本训练与推理设计。NSA通过动态分层稀疏策略和硬件优化，显著提升AI模型在长上下文推理中的性能，同时降低成本。DeepSeek创始人梁文锋是该论文作者之一。NSA在通用及长文本任务中表现出色，尤其在链式推理等复杂任务中展现潜力，推理速度大幅提升，最高可达11.6倍。此技术有望扩展大语言模型的应用范围。

原文链接

本文链接：https://kx.umi6.com/article/13719.html

转载请注明文章出处

AI模型