2025年10月20日,DeepSeek开源了3B参数的小模型DeepSeek-OCR,创新性地采用“光学压缩”技术处理文本信息。通过将文本转为图像,模型实现7-20倍的Token压缩率,同时保持OCR准确率高达97%以上。其核心组件包括负责图像特征提取的DeepEncoder和基于MoE设计的解码器DeepSeek-3B-MoE,能在高分辨率输入下控制内存开销,并支持多分辨率模式。团队利用3000万页多语言PDF数据训练模型,涵盖100种语言,还开发了“模型飞轮”机制优化少数语言识别能力。此外,DeepSeek-OCR具备深度解析功能,可提取复杂图像中的结构化数据,在STEM领域潜力巨大。研究还提出用光学压缩模拟人类遗忘机制,探索超长上下文处理的新方向。这一创新为VLM和LLM的发展开辟了新赛道。
原文链接
本文链接:https://kx.umi6.com/article/26997.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
英特尔展示Gaudi 3与B200混合型AI机架
2025-10-20 14:07:38
OpenAI 今年推出 GPT - 6?员工否认
2025-10-19 07:43:54
AI一问啥都会 上学还有必要吗 周鸿祎说透了
2025-10-18 18:37:35
微软下一代AI芯片或由英特尔代工
2025-10-20 13:06:13
OpenAl为何“情迷”变现
2025-10-19 12:48:56
有些时候真觉得,AI总结和「三分钟看电影」没啥区别
2025-10-20 10:03:33
古尔曼:iOS 26.4内部测试中的新版Siri表现不尽人意
2025-10-20 12:04:54
中国人工智能专利数量占全球60% 成为全球最大人工智能专利拥有国
2025-10-19 13:49:19
六大AI拿1万美元真实交易:DeepSeek最能赚,GPT-5亏麻了,AI能让周杰伦少亏上亿
2025-10-20 17:12:32
浮出水面!微软下一代Maia 2芯片或交由英特尔代工
2025-10-20 16:10:19
经济学诺奖得主的富二代人生:香奈儿老佛爷帮他写作业,AI时代反对向机器人征税
2025-10-19 23:54:47
547 文章
245269 浏览
24小时热文
更多

-
2025-10-20 22:14:28
-
2025-10-20 22:14:00
-
2025-10-20 21:14:11