近日,百度开源全新OCR模型Unlimited OCR,主打一口气连续解析数十页长文档。与传统逐页拼接不同,该模型创新引入“参考滑动窗口注意力(R-SWA)机制”,模仿人类“软遗忘”机制,使KV Cache保持恒定,有效解决长文档处理中显存与计算开销暴增痛点。测试显示,其在OmniDocBench刷新SOTA,成绩超越DeepSeek OCR,长文本推理速度提升约35%。此外,报告核心作者署名“YY”引发热议,被网友猜测为前DeepSeek研究员魏浩然。此举不仅重塑OCR体验,更为大模型长上下文管理提供新思路。
原文链接
本文链接:https://kx.umi6.com/article/36727.html
转载请注明文章出处
相关推荐
换一换
GPT-5.6突然发布!Fable5痛失最强基模王座
2026-06-27 10:51:01
美国组建AI供应链联盟围堵中国 欧盟正式入局
2026-06-25 18:37:27
1小时真机RL微调成功率破95%!HIL-ResRL:即插即用的VLA“外挂”神器
2026-06-24 18:44:53
中美合拍全AI动画《西游记:失落的500年》:解锁孙悟空五指山隐秘
2026-06-23 00:11:18
智能座舱之王「转身」物理AI,高通需要被重估了
2026-06-24 09:20:00
行业首个!大晓「晓途」开启机器狗开放场景7×24小时自主运营新模式
2026-06-26 20:23:19
聚焦GW级Token工厂,解码下一代算力底座|6月30日,深圳
2026-06-25 11:13:21
Claude Fable 5分批重新上线!GPT-5.6秒跟
2026-06-26 15:09:40
WAVES 2026:今年盛夏,在创投浪潮里,做迎风而立的少数人!
2026-06-26 11:04:48
企业微信AI助理大圆Agent开启内测:群聊、文档都能自动理解
2026-06-24 09:21:30
AI算力驱动培育钻石 业内人士:2027年或迎放量期
2026-06-26 15:15:26
AI硬件席卷618,钉钉A1包揽天猫、抖音、京东销量冠军
2026-06-22 14:45:14
Future Tech谁会成为下一个AI巨头?这175个早期项目站上WAIC2026
2026-06-24 18:42:40
685 文章
662379 浏览
24小时热文
更多
-
2026-06-28 14:43:32 -
2026-06-28 13:42:49 -
2026-06-27 21:13:09