2026-01-28 15:19:45
DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro
阅读:1746
2026年1月,DeepSeek开源全新OCR模型DeepSeek-OCR 2,专注于将PDF精准转换为Markdown。相比去年10月发布的初代模型,新版本弃用CLIP组件,改用轻量化的Qwen2-0.5B语言模型构建DeepEncoder V2,实现基于语义动态重排视觉标记的功能。这一升级解决了传统“光栅扫描”逻辑在复杂版面中的语义连贯性问题,并通过双流注意力机制提升性能。在OmniDocBench v1.5基准测试中,DeepSeek-OCR 2性能达到91.09%,较基线提升3.73%,效果媲美Gemini-3 Pro。此外,模型采用三阶段训练流程,优化数据采样与标签简化策略。项目已开源,代码和论文可在GitHub与HuggingFace获取。
原文链接
本文链接:https://kx.umi6.com/article/32280.html
转载请注明文章出处
相关推荐
换一换
DeepSeek发布DeepSeek-OCR 2模型
2026-01-27 14:21:20
DeepSeek开源全新OCR模型!弃用CLIP改用Qwen轻量小模型,性能媲美Gemini-3 Pro
2026-01-28 15:19:45
塑造“深圳经验”新范式 荣耀“链式”赋能中小企业数字化转型
2026-01-30 19:44:41
以色列专家与企业代表看好以中人工智能合作机遇
2026-01-29 19:37:55
在一个不允许犯错的行业:巨头向左、初创公司向右
2026-01-29 11:22:43
英伟达、微软、亚马逊正就向OpenAI投资高达600亿美元事宜展开谈判
2026-01-29 11:26:08
最近,启明创投拿下5个人工智能IPO
2026-01-30 13:41:19
央视起底新能源汽车行业网络黑产:车企间也会相互攻击 高管下场拉踩
2026-01-30 08:12:57
2026ASC世界大学生超级计算机竞赛“开锣” 聚焦人工智能等前沿
2026-01-30 09:20:36
360doc个人图书馆,0元卖
2026-01-30 13:40:10
国内首个!360发布“纳米漫剧流水线”,AI漫剧生成进入工业化时代
2026-01-30 22:51:57
微软CEO纳德拉:每季度在Microsoft Foundry上消费超100万美元的客户增长近80%
2026-01-30 09:19:30
当AI Agent遇到资本,为什么Genspark 能突出重围
2026-01-29 12:17:32
638 文章
441734 浏览
24小时热文
更多
-
2026-01-31 12:37:50 -
2026-01-31 12:36:53 -
2026-01-31 12:35:40