11月25日,腾讯混元宣布开源全新OCR模型HunyuanOCR,参数仅1B,多项核心能力达SOTA水平。该模型依托混元原生多模态架构,支持端到端推理,在复杂文档解析、文字检测与识别等任务中表现优异,如在OmniDocBench测评中获94.1分,超越谷歌Gemini3-pro;在OCRBench榜单上以860分领先3B以下参数模型。此外,HunyuanOCR支持14种小语种翻译,适用于票据字段抽取、视频字幕识别、拍照翻译等场景,并斩获ICDAR2025端到端文档翻译比赛小模型赛道冠军。模型已开源,可通过GitHub、HuggingFace等平台获取和体验。
原文链接
本文链接:https://kx.umi6.com/article/29093.html
转载请注明文章出处
相关推荐
换一换
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
2025-07-07 21:37:43
阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩
2025-09-01 15:21:09
原微软WizardLM项目团队加入腾讯混元
2025-05-14 15:18:55
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
腾讯混元 0.5B、1.8B、4B、7B模型发布
2025-08-04 16:02:12
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
2025-04-23 18:07:16
腾讯发布“业内首个” AI又要改造游戏行业了?
2025-05-20 15:50:18
腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
2025-06-27 17:11:39
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
腾讯混元3D AI创作引擎正式上线
2025-01-21 15:41:07
按需搭配一键叠穿,效果拿下新SOTA!中山大学&字节智创数字人团队提出虚拟试穿新框架
2024-07-02 14:50:22
在国际比赛中拿下 30 个第 1 名,腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B
2025-09-01 19:23:51
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
554 文章
316172 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07