1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年10月17日,百度发布并开源了自研多模态文档解析模型PaddleOCR-VL,以仅0.9B参数量登顶OmniDocBench V1.5榜单,综合得分92.6,成为全球性能第一的OCR模型。该模型在文本识别、公式识别、表格理解、阅读顺序四大核心能力上全面刷新SOTA,支持109种语言及复杂场景解析。其创新两阶段架构和轻量化设计使其在效率与精度上领先同类模型,并能在单张A100 GPU上实现1881 token/s的推理速度。PaddleOCR-VL已在GitHub开源,技术报告和体验Demo同步上线,标志着中国模型在全球多模态文档解析领域树立新标准。

原文链接
本文链接:https://kx.umi6.com/article/26852.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
英伟达开源 OCR 代码推理 AI 模型:LiveCodeBench 基准超 OpenAI o3-Mini 和 o1(low)
2025-05-09 14:54:42
百度摊牌了
2024-11-13 18:47:09
全球OCR最强模型仅0.9B!百度文心衍生模型刚刚横扫4项SOTA
2025-10-17 18:22:56
百度文心智能体平台免费开放文心4.0
2024-07-06 04:01:12
腾讯混元 OCR 模型宣布开源:参数仅 1B,多项核心能力 SOTA
2025-11-25 14:56:08
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
百度文心 App 内测“多人多 Agent”群聊,1 月下旬逐步开放
2026-01-16 16:46:11
只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型
2025-10-24 16:47:14
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
2026年OpenAI最看好的3个方向
2026-01-21 17:20:17
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
摩尔线程携手硅基流动实现DeepSeek-V3大模型高性能推理
2026-01-21 20:31:18
粤芯半导体年产48万片晶圆生产线启动 总投资252亿元
2026-01-22 22:15:16
24小时热文
更多
扫一扫体验小程序