1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年7月31日,DeepSeek团队在ACL 2025上荣获最佳论文奖。梁文锋作为通讯作者,与北京大学联合发表的论文提出原生稀疏注意力(NSA)机制,通过算法与硬件协同优化,使长文本处理速度提升11倍,且性能超越传统全注意力模型。论文一作袁境阳透露,该技术可将上下文扩展至1百万tokens,并可能应用于下一代DeepSeek-V4及DeepSeek-R2模型。NSA在多项基准测试中表现优异,尤其在长文本和复杂推理任务上显著领先。此外,本次ACL还评选出其他三篇最佳论文,分别来自北大、斯坦福等团队,研究涉及模型对齐弹性、公平性差异感知及LLM采样机制理论。

原文链接
本文链接:https://kx.umi6.com/article/22743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
你是否也曾榨干过DeepSeek?
2025-04-21 21:54:35
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
2025-07-21 21:22:47
AI“胡编乱造”,背刺了谁?
2025-04-08 19:06:44
大模型退火之后,AI手机还好吗
2025-06-25 08:26:26
压力给到梁文锋
2025-04-16 22:15:44
《流浪地球 3》剧组用上专属 AI 问答应用 WEi:基于 DeepSeek,内部资料高效检索
2025-04-15 12:29:52
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
2025-04-18 23:25:46
玩完 DeepSeek R1 新版,外国网友又「蚌埠住了」?
2025-06-03 10:50:11
宝马中国将接入DeepSeek!爆新世代车型搭载AI智能体
2025-04-27 14:16:44
OpenAI CEO山姆·奥特曼:DeepSeek并未影响GPT的增长 将推更好的开源模型
2025-04-14 13:33:39
Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?
2025-07-17 17:30:33
谁是开源界的杠把子?
2025-04-11 13:50:08
K时评:以讹传讹 DeepSeek向王一博道歉或为“乌龙事件”
2025-07-04 19:49:07
24小时热文
更多
扫一扫体验小程序