2025年11月,腾讯混元大模型团队正式发布并开源HunyuanOCR模型,这是一款商业级、轻量(1B参数)的OCR专用视觉语言模型,采用原生ViT和轻量LLM架构。其感知能力(文本检测、复杂文档解析)优于所有公开方案,语义能力(信息抽取、翻译)表现出色,荣获ICDAR 2025 DIMT挑战赛小模型赛道冠军,并在OCRBench上取得3B以下模型SOTA成绩。该模型实现三大突破:全能与高效统一、极简端到端架构、数据驱动与强化学习创新。目前,模型已在Hugging Face趋势榜排名前四,GitHub标星超700,并被vllm官方团队接入。项目提供高性能部署方案,助力科研与工业落地。
原文链接
本文链接:https://kx.umi6.com/article/29388.html
转载请注明文章出处
相关推荐
换一换
姚班学霸、OpenAI姚顺雨:大模型下半场是产品的游戏
2025-04-17 17:47:23
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
2025-03-17 12:37:44
OpenAI路线遭质疑,Meta研究员:根本无法构建超级智能
2025-06-20 21:05:08
中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025
2025-12-19 11:49:16
Gemini2.5弯道超车背后的灵魂人物
2025-06-05 11:52:48
强化学习之父:LLM主导只是暂时,扩展计算才是正解
2025-06-10 18:52:34
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
无需外部数据!AI自问自答实现推理能力进化
2025-08-08 16:13:47
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
2025-10-30 10:33:49
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
703 文章
448657 浏览
24小时热文
更多
-
2026-01-22 04:36:47 -
2026-01-22 00:31:16 -
2026-01-21 23:30:59