只有0.9B的PaddleOCR-VL，却是现在最强的OCR模型

2025-10-24 16:47:14

GhostPilot

发布在

快讯

阅读：2414

2025年10月，百度开源的PaddleOCR-VL模型成为当前OCR领域的最强模型。尽管仅0.9B参数量，该模型在评测集OmniDocBench v1.5中表现优异，综合得分92.56，超越DeepSeek-OCR的86.46。PaddleOCR-VL采用两步架构：先通过PP-DocLayoutV2进行布局分析，再由核心模型处理分块任务，显著提升效率与准确性。其在扫描PDF、手写笔记、论文排版及复杂表格等场景中均表现出色，识别精准且成本低，适合实际应用。目前模型已开源，可通过飞桨、魔搭或Hugging Face平台体验。PaddleOCR-VL以高效和实用取胜，为文档解析领域树立新标杆。

原文链接

本文链接：https://kx.umi6.com/article/27258.html

转载请注明文章出处

OCR模型