1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:2026年4月,北大张牧涵团队提出新稀疏注意力机制HISA(分层索引稀疏注意力),突破64K上下文索引瓶颈,在DeepSeek-V3.2和GLM-5模型上实现2-4倍提速且几乎不丢精度。HISA通过块级粗过滤与块内精挑字符两步操作,将复杂度从O(L²)降至O(L²/B + L×m×B),大幅降低计算成本,同时支持即插即用无需重新训练。实验显示,HISA在64K长度文本下最高提速3.75倍,精度与原方法DSA持平,尤其在长文本理解与关键信息检索任务中表现优异。团队未来计划改进块划分方式并探索联合训练优化筛选精度。

原文链接
本文链接:https://kx.umi6.com/article/34489.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国大模型首登Nature封面!DeepSeek首次披露:R1训练只花200万
2025-09-18 13:51:50
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
DeepSeek新模型上线
2025-09-30 11:25:43
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
Similarweb 报告 13 日全球 AI 流量:Gemini 成 ChatGPT 最强劲对手,DeepSeek 正收复失地
2025-11-15 12:48:52
DeepSeek网页及API服务中断
2026-05-28 11:19:14
DeepSeek专家模式无法上传文件 官方提示:目前资源紧张
2026-05-14 16:48:15
DeepSeek 声明:防范冒用“深度求索”名义实施诈骗
2025-09-18 12:52:40
DeepSeek突然拥抱国产GPU语言!对标CUDA替代Triton,华为Day0适配
2025-09-30 10:23:35
MAU被豆包反超,Deepseek挤了点牙膏
2025-10-21 15:28:27
黄仁勋新年第一场演讲提了DeepSeek 推动了整个行业变革
2026-01-06 08:54:05
Deepseek官网公布deepseek-v4接口文档
2026-04-24 11:10:00
DeepSeek发布两款新模型
2025-12-01 19:31:03
24小时热文
更多
扫一扫体验小程序