1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年7月31日,DeepSeek团队在ACL 2025上荣获最佳论文奖。梁文锋作为通讯作者,与北京大学联合发表的论文提出原生稀疏注意力(NSA)机制,通过算法与硬件协同优化,使长文本处理速度提升11倍,且性能超越传统全注意力模型。论文一作袁境阳透露,该技术可将上下文扩展至1百万tokens,并可能应用于下一代DeepSeek-V4及DeepSeek-R2模型。NSA在多项基准测试中表现优异,尤其在长文本和复杂推理任务上显著领先。此外,本次ACL还评选出其他三篇最佳论文,分别来自北大、斯坦福等团队,研究涉及模型对齐弹性、公平性差异感知及LLM采样机制理论。

原文链接
本文链接:https://kx.umi6.com/article/22743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek等开源模型,更“浪费”token吗?
2025-10-11 10:17:13
DeepSeek线上模型升级:当前版本号 DeepSeek-V3.1-Terminus
2025-09-22 21:05:30
DeepSeek成了硅谷最大的“不能说的秘密”
2025-09-23 17:20:46
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
西门子 CTO 大夸 DeepSeek:预计三五年后西门子的所有产品都将融入 AI 元素
2025-06-25 15:32:02
ColorOS 小布助手月活量达 1.5 亿,OPPO 手机(含一加)接入 DeepSeek 设备量行业第一
2025-06-10 15:49:36
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据
2025-09-18 14:54:07
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
K2开源大模型,会是Kimi的DeepSeek时刻吗?
2025-07-14 11:19:10
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界
2025-09-16 12:10:49
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
2025-07-21 09:13:49
好险,差点被DeepSeek幻觉害死
2025-07-09 15:08:10
24小时热文
更多
扫一扫体验小程序