1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月20日,DeepSeek-AI团队发布论文《DeepSeek-OCR:Contexts Optical Compression》,提出利用视觉模态压缩长文本上下文的新方法,并开源模型DeepSeek-OCR。该模型由核心编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M组成,参数量为3B。DeepEncoder在高分辨率输入下保持低计算激活,同时实现高压缩比。实验显示,在文本token数量不超过视觉token的10倍时,OCR精度可达97%;即使压缩比达20×,准确率仍约60%。在OmniDocBench测试中,使用100个视觉token即可超越GOT-OCR2.0,不到800个视觉token优于MinerU2.0。实际生产中,单块A100-40G显卡每天可生成超20万页训练数据。项目已在GitHub和Hugging Face开源。

原文链接
本文链接:https://kx.umi6.com/article/26977.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
2025-10-21 10:24:34
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
端侧AI下半场,从跑起来到会思考
2026-01-21 15:15:34
xAI工程师播客聊太嗨,马斯克解雇了他
2026-01-21 18:20:58
欧盟提出《数字网络法案》拟统一网络连接规则
2026-01-21 19:24:13
突发!xAI联创杨格过劳病离职,给马斯克干活压力山大
2026-01-21 17:21:29
昇腾云客户2663家,华为云稳居最大国产AI云服务提供商
2026-01-22 17:01:32
小米超级小爱近期更新功能一览公布,含随心修图、AI 文生图、圈屏搜题等
2026-01-21 16:17:25
广东:推广邮政快递末端智能收派服务 推动无人车、无人机与智能快件箱协同配送
2026-01-21 17:22:35
苏州“十五五”规划建议:培育壮大半导体与集成电路、智能网联新能源汽车、工业母机等新兴支柱产业
2026-01-21 20:30:12
24小时热文
更多
扫一扫体验小程序