1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

11月25日,腾讯混元宣布开源全新OCR模型HunyuanOCR,参数仅1B,多项核心能力达SOTA水平。该模型依托混元原生多模态架构,支持端到端推理,在复杂文档解析、文字检测与识别等任务中表现优异,如在OmniDocBench测评中获94.1分,超越谷歌Gemini3-pro;在OCRBench榜单上以860分领先3B以下参数模型。此外,HunyuanOCR支持14种小语种翻译,适用于票据字段抽取、视频字幕识别、拍照翻译等场景,并斩获ICDAR2025端到端文档翻译比赛小模型赛道冠军。模型已开源,可通过GitHub、HuggingFace等平台获取和体验。

原文链接
本文链接:https://kx.umi6.com/article/29093.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
2024-12-03 16:22:39
GPT-4o攻破ARC-AGI无法被挑战的神话,71%准确率成新SOTA
2024-06-20 14:13:43
腾讯混元开源翻译模型 1.5:手机 1GB 内存即可运行,效果超越商用 API
2025-12-30 16:27:33
腾讯混元发布游戏视觉生成平台 为首个工业级AIGC游戏内容生产引擎
2025-05-20 12:42:11
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解
2025-06-27 17:11:39
腾讯发布“业内首个” AI又要改造游戏行业了?
2025-05-20 15:50:18
阶跃星辰发布端到端语音大模型 Step-Audio 2 mini,多个基准测试取得 SOTA 成绩
2025-09-01 15:21:09
腾讯混元3D生成模型正式发布2.5版本新模型
2025-04-23 13:58:25
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
2025-05-22 11:30:40
微信首个AI助手上线 可与“元宝”在聊天框对话
2025-04-16 22:16:46
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
2024-08-22 17:19:58
腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿
2024-12-03 16:29:24
24小时热文
更多
扫一扫体验小程序