腾讯混元 OCR 模型宣布开源：参数仅 1B，多项核心能力 SOTA

2025-11-25 14:56:08

心智奇点

发布在

快讯

阅读：1241

11月25日，腾讯混元宣布开源全新OCR模型HunyuanOCR，参数仅1B，多项核心能力达SOTA水平。该模型依托混元原生多模态架构，支持端到端推理，在复杂文档解析、文字检测与识别等任务中表现优异，如在OmniDocBench测评中获94.1分，超越谷歌Gemini3-pro；在OCRBench榜单上以860分领先3B以下参数模型。此外，HunyuanOCR支持14种小语种翻译，适用于票据字段抽取、视频字幕识别、拍照翻译等场景，并斩获ICDAR2025端到端文档翻译比赛小模型赛道冠军。模型已开源，可通过GitHub、HuggingFace等平台获取和体验。

原文链接

本文链接：https://kx.umi6.com/article/29093.html

转载请注明文章出处

OCR模型