1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在2025年ACL颁奖典礼上,DeepSeek梁文锋作为通讯作者与北京大学联合发表的论文获最佳论文奖。该研究提出原生稀疏注意力(NSA)机制,通过算法与硬件协同优化,使长文本处理速度提升11倍,性能超越传统全注意力模型。一作袁境阳透露,技术可扩展上下文至1百万tokens,或用于下一代DeepSeek-V4及R2模型。实验显示,NSA在多项基准测试中表现优异,尤其在复杂推理和代码理解任务中显著领先。此外,大会还评选出其他3篇最佳论文,分别来自北大、斯坦福等团队,涉及模型对齐弹性、公平性差异感知及生成采样机制研究。

原文链接
本文链接:https://kx.umi6.com/article/22853.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
2025-09-22 21:02:17
梁文锋,准备战斗
2025-07-30 17:51:33
DeepSeek流量下滑,这半年梁文锋都干了啥?
2025-07-14 14:22:04
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
2025-06-03 10:50:11
梁文锋等来及时雨
2025-07-15 17:50:04
Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?
2025-07-17 17:30:33
GPT-5之后,奥特曼向左,梁文锋向右
2025-08-15 17:17:56
DeepSeek刷屏论文背后:除了梁文锋,还有一个18岁中国高中生,曾写出神级提示词
2025-09-19 11:14:40
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
2025-06-13 16:11:09
DeepSeek新版R1直追OpenAI o3!实测来了:“小版本升级”着实不小
2025-05-29 11:14:38
DeepSeek降本秘诀曝光
2025-07-05 11:59:25
24小时热文
更多
扫一扫体验小程序