1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

美团龙猫LongCat系列推出全新稀疏注意力机制LoZA(LongCat ZigZag Attention),显著提升长文本处理能力。新技术将上下文窗口扩展至1M,解码速度比之前快10倍,且在256K文本预加载时提速超50%。

全注意力机制因平方级计算复杂度(O(L²))难以高效处理长文本。LoZA通过“只算关键部分”优化这一瓶颈。具体方法是:先为多头潜在注意力模块(MLA)引入可学习权重α,筛选出对性能影响较小的模块;然后将其中50%低性能模块替换为线性复杂度(O(L·S))的流式稀疏注意力(SSA)。这种交错结构被称为ZigZag,既保留模型理解能力,又大幅降低计算成本。

此外,LoZA设计了1024Token稀疏窗口,包含1个全局块和7个局部块,分别负责整体关联与局部细节。改造无需从头训练,可在中期完成,成本较低。测试显示,LoZA在速度和性能上均表现出色:处理128K上下文时解码速度快10倍;256K上下文预加载提速50%,后续解码节省30%算力,硬件效率翻倍。同时,其性能未因简化缩水,在回答问题、写代码等任务中与原版持平,长文本任务表现更优,甚至超越Qwen-3模型。

未来,团队计划让LoZA支持动态稀疏比例,根据场景自动调整全注意力与稀疏模块比例,并探索多模态应用。论文地址:https://www.alphaxiv.org/abs/2512.23966

原文链接
本文链接:https://kx.umi6.com/article/31552.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
阿里通义千问发布 Qwen2.5-Turbo 开源 AI 模型:支持 100 万 tokens 上下文,处理时间缩短至 68 秒
2024-11-19 14:52:17
DeepSeek下一代技术提前曝光
2025-07-31 09:02:46
字节跳动开源长文本处理模型Seed-OSS-36B
2025-08-21 14:39:00
腾讯发最大开源MoE模型,3890亿参数免费可商用,跑分超Llama3.1
2024-11-07 10:16:21
0.5B以小搏大拿下端侧模型新SOTA:4090可跑,长文本处理5倍常规加速丨清华&面壁开源
2025-06-10 16:50:15
Qwen开源首个长文本新模型,百万Tokens处理性能超GPT-4o-mini
2025-01-27 14:30:40
LG 发布 EXAONE 3.5 开源 AI 模型:长文本处理利器、独特技术有效降低“幻觉”
2024-12-11 09:21:31
OpenAI发布GPT-4.1:开发者“特供”,超越4o,但还没遥遥领先
2025-04-15 15:34:47
CVPR 2026现场直击:CV与机器人的物理结界被彻底打破
2026-06-05 19:24:24
AI正加速劣质假新闻传播 詹姆斯发声吐槽:你们觉得呢
2026-06-08 10:19:48
人类药丸?Anthropic为什么要搞AI不扩散条约
2026-06-07 13:33:45
有余凯不投的地平线离职创业员工吗?
2026-06-07 21:50:41
当任何人都能用AI把公司告上法庭 法官们慌了
2026-06-03 17:29:26
24小时热文
更多
扫一扫体验小程序