10月20日,DeepSeek-AI团队发布论文《DeepSeek-OCR:Contexts Optical Compression》,提出利用视觉模态压缩长文本上下文的新方法,并开源模型DeepSeek-OCR。该模型由核心编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M组成,参数量为3B。DeepEncoder在高分辨率输入下保持低计算激活,同时实现高压缩比。实验显示,在文本token数量不超过视觉token的10倍时,OCR精度可达97%;即使压缩比达20×,准确率仍约60%。在OmniDocBench测试中,使用100个视觉token即可超越GOT-OCR2.0,不到800个视觉token优于MinerU2.0。实际生产中,单块A100-40G显卡每天可生成超20万页训练数据。项目已在GitHub和Hugging Face开源。
原文链接
本文链接:https://kx.umi6.com/article/26977.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
阿里夸克正推进一项AI业务 涉对话式AI应用
2025-10-20 18:12:58
大模型中毒记
2025-10-20 20:12:54
AI助手Cici悄然霸榜海外,又是字节
2025-10-20 13:05:07
我国生成式AI用户规模超五亿人 超九成用户首选国产大模型
2025-10-19 09:46:55
4人团队一年估值2.5亿美金,一款产品征服投资人
2025-10-19 15:54:59
超 35 万件智能类产品亮相第 138 届广交会,参展企业超 3.2 万家创历史新高
2025-10-18 23:39:47
国家知识产权局:推动知识产权与人工智能共生演进、融合发展
2025-10-18 19:37:45
科大讯飞:第三季度净利润同比增长202%
2025-10-20 18:14:04
朱云来:标普500中AI相关股票的合计市值占比已升至43%
2025-10-18 16:37:39
AI不存在泡沫 也不愁盈利:美国家庭靠炒股就赚了35万亿
2025-10-19 21:54:09
狂奔20天,全网“追赶”Sora2
2025-10-20 10:05:52
为什么AI写的文章 总有一股“AI味”
2025-10-18 21:38:22
521 文章
249759 浏览
24小时热文
更多

-
2025-10-20 20:12:54
-
2025-10-20 19:14:40
-
2025-10-20 19:14:25