2025年10月17日,百度发布并开源了自研多模态文档解析模型PaddleOCR-VL,以仅0.9B参数量登顶OmniDocBench V1.5榜单,综合得分92.6,成为全球性能第一的OCR模型。该模型在文本识别、公式识别、表格理解、阅读顺序四大核心能力上全面刷新SOTA,支持109种语言及复杂场景解析。其创新两阶段架构和轻量化设计使其在效率与精度上领先同类模型,并能在单张A100 GPU上实现1881 token/s的推理速度。PaddleOCR-VL已在GitHub开源,技术报告和体验Demo同步上线,标志着中国模型在全球多模态文档解析领域树立新标准。
原文链接
本文链接:https://kx.umi6.com/article/26852.html
转载请注明文章出处
相关推荐
.png)
换一换
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
2025-05-09 14:54:42
百度摊牌了
2024-11-13 18:47:09
百度文心智能体平台免费开放文心4.0
2024-07-06 04:01:12
全球OCR最强模型仅0.9B!百度文心衍生模型刚刚横扫4项SOTA
2025-10-17 18:22:56
小米集团创始人雷军:AI大模型是智能网联汽车的未来趋势
2025-10-16 18:00:06
Meta前高管警告:AI市场大概率会有一波调整
2025-10-16 20:00:09
谷歌 DeepMind 入局“人造太阳”控制系统,AI 挑战 1 亿摄氏度高温
2025-10-17 09:11:34
英伟达黄仁勋长女 Madison Huang 直播首秀,聊了具身智能
2025-10-17 10:12:34
毕马威调查数据:69%的CEO计划在未来一年内将10%-20%预算投入AI领域
2025-10-16 20:01:16
OpenAI模型Sora 2上线微软Azure AI Foundry(国际版)
2025-10-17 12:17:00
AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%
2025-10-17 14:17:43
Snowflake和Palantir宣布建立战略合作伙伴关系
2025-10-16 20:02:21
报告:2027年AI软硬件整体市场规模将达到7800亿至9900亿美元
2025-10-16 17:59:01
539 文章
255748 浏览
24小时热文
更多

-
2025-10-18 00:27:26
-
2025-10-17 22:28:16
-
2025-10-17 22:27:04