2025年11月,腾讯混元大模型团队正式发布并开源HunyuanOCR模型,这是一款商业级、轻量(1B参数)的OCR专用视觉语言模型,采用原生ViT和轻量LLM架构。其感知能力(文本检测、复杂文档解析)优于所有公开方案,语义能力(信息抽取、翻译)表现出色,荣获ICDAR 2025 DIMT挑战赛小模型赛道冠军,并在OCRBench上取得3B以下模型SOTA成绩。该模型实现三大突破:全能与高效统一、极简端到端架构、数据驱动与强化学习创新。目前,模型已在Hugging Face趋势榜排名前四,GitHub标星超700,并被vllm官方团队接入。项目提供高性能部署方案,助力科研与工业落地。
原文链接
本文链接:https://kx.umi6.com/article/29388.html
转载请注明文章出处
相关推荐
换一换
通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API
2025-05-17 13:07:29
稚晖君机器人“葡萄缝针”神技再现江湖 这次是人形的
2025-03-11 23:55:21
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
我不给人做产品,给Agent做
2025-06-30 08:39:41
又一篇“苦涩的教训”,让AI觉得人间有不值,发现无穷尽
2025-04-22 08:10:09
蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
2025-10-24 11:36:00
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025
2025-04-09 21:08:08
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
Thinking Machine新研究刷屏!结合RL+微调,小模型训练更具性价比
2025-10-28 10:41:47
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
宇树和智元爆火背后:人类是如何给机器人注入灵魂的?
2025-03-14 09:00:17
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
648 文章
367328 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07