参考滑动窗口注意力

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

一次吃下一本书！百度开源新OCR，作者疑似前DeepSeek研究员

近日，百度开源全新OCR模型Unlimited OCR，主打一口气连续解析数十页长文档。与传统逐页拼接不同，该模型创新引入“参考滑动窗口注意力（R-SWA）机制”，模仿人类“软遗忘”机制，使KV Cache保持恒定，有效解决长文档处理中显存与计算开销暴增痛点。测试显示，其在OmniDocBench刷新SOTA，成绩超越DeepSeek OCR，长文本推理速度提升约35%。此外，报告核心作者署名“YY”引发热议，被网友猜测为前DeepSeek研究员魏浩然。此举不仅重塑OCR体验，更为大模型长上下文管理提供新思路。

原文链接