DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能 - AI优秘圈

1

免责声明：Al优秘圈所有资讯仅代表作者个人观点，不构成任何投资理财建议。请确保访问网址为（kx.umi6.com) 投诉及建议

7*24小时快讯

AI科普

合作

扫一扫体验小程序

小杨哥

个人资料

曝光推广

客户留言

投诉及建议

退出登录

×

7*24小时快讯 AI科普合作

2025-02-18 17:24:09

DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能

智慧轨迹

发布在

快讯

阅读：582

2月18日，DeepSeek宣布推出NSA（Native Sparse Attention），一种硬件对 alignments 且原生可训练的稀疏注意力机制，旨在加速推理并降低成本，同时保持性能。NSA的核心组件包括动态分层稀疏策略、粗粒度token压缩及细粒度token选择。DeepSeek表示，该机制在通用基准、长上下文任务和基于指令的推理中表现出色，不逊于全注意力模型。更多信息参见：

原文链接

本文链接：https://kx.umi6.com/article/13693.html

转载请注明文章出处

NSA

稀疏注意力机制

降低成本

分享至

打开微信扫一扫

内容投诉

生成图片

智慧轨迹

589 文章

372012 浏览

阅读更多

24小时热文

更多

探索机器人“无遥操”，ATEC2025科技精英赛在港收官

2025-12-08 18:41:52
马斯克最新宏大设想：每年发射百万吨级的卫星来扩张 AI 算力

2025-12-08 18:40:45
全球首个光子芯片全链垂直大模型 LightSeek 开放：整合国内首条中试线数据，整体研发效率提升 7 倍

2025-12-08 18:40:02

扫一扫体验小程序