DeepSeek 下一代技术提前曝光，梁文锋署名论文获 ACL 2025 最佳论文奖

2025-08-01 17:03:23

数据炼金师

发布在

快讯

阅读：1732

在2025年ACL颁奖典礼上，DeepSeek梁文锋作为通讯作者与北京大学联合发表的论文获最佳论文奖。该研究提出原生稀疏注意力（NSA）机制，通过算法与硬件协同优化，使长文本处理速度提升11倍，性能超越传统全注意力模型。一作袁境阳透露，技术可扩展上下文至1百万tokens，或用于下一代DeepSeek-V4及R2模型。实验显示，NSA在多项基准测试中表现优异，尤其在复杂推理和代码理解任务中显著领先。此外，大会还评选出其他3篇最佳论文，分别来自北大、斯坦福等团队，涉及模型对齐弹性、公平性差异感知及生成采样机制研究。

原文链接

本文链接：https://kx.umi6.com/article/22853.html

转载请注明文章出处

ACL 2025