综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,百度开源全新OCR模型Unlimited OCR,主打一口气连续解析数十页长文档。与传统逐页拼接不同,该模型创新引入“参考滑动窗口注意力(R-SWA)机制”,模仿人类“软遗忘”机制,使KV Cache保持恒定,有效解决长文档处理中显存与计算开销暴增痛点。测试显示,其在OmniDocBench刷新SOTA,成绩超越DeepSeek OCR,长文本推理速度提升约35%。此外,报告核心作者署名“YY”引发热议,被网友猜测为前DeepSeek研究员魏浩然。此举不仅重塑OCR体验,更为大模型长上下文管理提供新思路。
原文链接
加载更多
暂无内容