11月25日,腾讯混元宣布开源全新OCR模型HunyuanOCR,参数仅1B,多项核心能力达SOTA水平。该模型依托混元原生多模态架构,支持端到端推理,在复杂文档解析、文字检测与识别等任务中表现优异,如在OmniDocBench测评中获94.1分,超越谷歌Gemini3-pro;在OCRBench榜单上以860分领先3B以下参数模型。此外,HunyuanOCR支持14种小语种翻译,适用于票据字段抽取、视频字幕识别、拍照翻译等场景,并斩获ICDAR2025端到端文档翻译比赛小模型赛道冠军。模型已开源,可通过GitHub、HuggingFace等平台获取和体验。
原文链接
本文链接:https://kx.umi6.com/article/29093.html
转载请注明文章出处
相关推荐
换一换
腾讯混元图像2模型发布 支持文本、语音、草图等交互方式
2025-05-16 17:13:07
腾讯混元自研深度思考模型「T1」正式发布
2025-03-21 23:47:21
4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究
2025-04-13 19:51:00
腾讯发布“业内首个” AI又要改造游戏行业了?
2025-05-20 15:50:18
月之暗面发布k1.5多模态思考模型
2025-01-20 23:27:40
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
微信首个AI助手上线 可与“元宝”在聊天框对话
2025-04-16 22:16:46
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
2025-08-06 11:26:58
腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
2025-06-27 17:11:39
悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%
2024-06-18 15:31:25
腾讯混元3D生成模型正式发布2.5版本新模型
2025-04-23 13:58:25
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
594 文章
376634 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34