2025年7月31日,DeepSeek团队在ACL 2025上荣获最佳论文奖。梁文锋作为通讯作者,与北京大学联合发表的论文提出原生稀疏注意力(NSA)机制,通过算法与硬件协同优化,使长文本处理速度提升11倍,且性能超越传统全注意力模型。论文一作袁境阳透露,该技术可将上下文扩展至1百万tokens,并可能应用于下一代DeepSeek-V4及DeepSeek-R2模型。NSA在多项基准测试中表现优异,尤其在长文本和复杂推理任务上显著领先。此外,本次ACL还评选出其他三篇最佳论文,分别来自北大、斯坦福等团队,研究涉及模型对齐弹性、公平性差异感知及LLM采样机制理论。
原文链接
本文链接:https://kx.umi6.com/article/22743.html
转载请注明文章出处
相关推荐
换一换
DeepSeek线上模型版本升级至V3.1
2025-08-19 20:04:27
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
2025-12-03 00:44:54
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?
2025-07-17 17:30:33
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
DeepSeek催化下,芯片带领沪指突破3800点
2025-08-22 20:52:41
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
2025-09-18 14:54:07
网友称“Deepseek演都不演了”:输入手机内存不够“二选一删谁” 秒回答豆包
2025-08-20 17:26:16
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
六大AI大模型展开美股投资竞赛:重仓英伟达的Deepseek再次领跑
2025-10-28 18:00:23
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
2025-08-01 17:03:23
DeepSeek V3.1突现离谱Bug:“极”字满屏乱蹦,开发者一脸懵逼
2025-08-26 14:46:26
648 文章
425723 浏览
24小时热文
更多
-
2026-01-23 08:40:41 -
2026-01-23 06:34:26 -
2026-01-23 00:20:44