在2025年ACL颁奖典礼上,DeepSeek梁文锋作为通讯作者与北京大学联合发表的论文获最佳论文奖。该研究提出原生稀疏注意力(NSA)机制,通过算法与硬件协同优化,使长文本处理速度提升11倍,性能超越传统全注意力模型。一作袁境阳透露,技术可扩展上下文至1百万tokens,或用于下一代DeepSeek-V4及R2模型。实验显示,NSA在多项基准测试中表现优异,尤其在复杂推理和代码理解任务中显著领先。此外,大会还评选出其他3篇最佳论文,分别来自北大、斯坦福等团队,涉及模型对齐弹性、公平性差异感知及生成采样机制研究。
原文链接
本文链接:https://kx.umi6.com/article/22853.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek独占鳌头!中国AI原生App月活突破2.4亿:豆包、元宝紧随
2025-04-16 15:08:29
黄仁勋已结束中国之行 知情人士称全程未与DeepSeek会面
2025-04-19 11:43:03
DeepSeek崩上热搜 内部人员回应:正在处理中,请稍后尝试
2025-05-13 18:58:41
ColorOS 小布助手月活量达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一
2025-06-10 15:49:36
周鸿祎解读DeepSeek更新:中美AI实力已平起平坐
2025-06-09 17:33:29
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
DeepSeek下一代技术提前曝光,梁文锋署名论文获ACL2025最佳论文奖
2025-07-31 09:00:51
DeepSeek对“王一博案”道歉?假新闻!
2025-07-03 23:32:06
OpenAI CEO山姆·奥特曼:DeepSeek并未影响GPT的增长 将推更好的开源模型
2025-04-14 13:33:39
黄仁勋力赞DeepSeek 对中国创新能力充满信心
2025-07-21 04:12:05
3万字读懂:一季度全球AI应用,谁暴涨?谁掉队?
2025-05-09 14:55:56
DeepSeek核心高管离职创业,瞄准Agent赛道|独家
2025-06-09 16:30:51
433 文章
69486 浏览
24小时热文
更多

-
2025-08-02 14:20:17
-
2025-08-02 14:19:08
-
2025-08-02 14:17:45