全球OCR最强模型仅0.9B！百度文心衍生模型刚刚横扫4项SOTA

2025-10-17 18:22:56

发布在

快讯

阅读：2264

2025年10月17日，百度发布并开源了自研多模态文档解析模型PaddleOCR-VL，以仅0.9B参数量登顶OmniDocBench V1.5榜单，综合得分92.6，成为全球性能第一的OCR模型。该模型在文本识别、公式识别、表格理解、阅读顺序四大核心能力上全面刷新SOTA，支持109种语言及复杂场景解析。其创新两阶段架构和轻量化设计使其在效率与精度上领先同类模型，并能在单张A100 GPU上实现1881 token/s的推理速度。PaddleOCR-VL已在GitHub开源，技术报告和体验Demo同步上线，标志着中国模型在全球多模态文档解析领域树立新标准。

原文链接

本文链接：https://kx.umi6.com/article/26852.html

转载请注明文章出处

OCR模型