1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年7月31日,DeepSeek与北京大学联合发表的论文《Native Sparse Attention》获ACL最佳论文奖。该研究提出一种新方法NSA(原生稀疏注意力),首次将稀疏注意力引入完整训练流程,性能不降反升,推理速度提升11倍。NSA通过“粗读摘要、精读重点、强记最近”三种策略动态分配注意力,在长文本处理中表现优异,如64k长度序列的信息检索准确率达100%。此技术已在27B模型上完成预训练验证,未来或大幅降低AI使用成本,提升效率。搭载NSA的下一代DeepSeek模型备受期待。

原文链接
本文链接:https://kx.umi6.com/article/22791.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
DeepSeek推理最高提速6倍!开源研究:加装「思维进度条」,计算量减少30%
2025-07-08 14:44:52
R2还没来,但DeepSeek的秘密武器已经“剧透”了
2025-08-01 09:10:49
英伟达提出全新 Star Attention:10 倍加速大语言模型推理,登顶 Hugging Face 论文榜
2024-12-05 14:04:18
腾讯云将全面升级云基础设施
2025-09-16 15:16:55
苏州“十五五”规划建议:推进人工智能驱动的新型科研范式、技术研发、工程实现、产品落地一体化协同发展 积极部署人工智能芯片、量子等创新应用技术
2026-01-21 20:27:59
vivo暂缓AI眼镜项目
2026-01-23 09:43:53
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
2025 年 ACM Fellow 名单公布:郑宇、梅涛、金海、陈宝权等 19 名华人学者入榜
2026-01-23 11:50:59
DeepMind CEO:对OpenAI引入广告感到惊讶 Gemini目前没这种计划
2026-01-23 15:00:51
亚马逊又将大手笔裁员!AI被指罪魁祸首 高薪行政人员首当其冲
2026-01-23 12:56:24
马斯克:人工智能部署的限制因素是电力供应
2026-01-23 00:20:44
百川发布循证增强医疗大模型M3 Plus
2026-01-22 14:59:21
24小时热文
更多
扫一扫体验小程序