1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年10月20日,DeepSeek开源了3B参数的小模型DeepSeek-OCR,创新性地采用“光学压缩”技术处理文本信息。通过将文本转为图像,模型实现7-20倍的Token压缩率,同时保持OCR准确率高达97%以上。其核心组件包括负责图像特征提取的DeepEncoder和基于MoE设计的解码器DeepSeek-3B-MoE,能在高分辨率输入下控制内存开销,并支持多分辨率模式。团队利用3000万页多语言PDF数据训练模型,涵盖100种语言,还开发了“模型飞轮”机制优化少数语言识别能力。此外,DeepSeek-OCR具备深度解析功能,可提取复杂图像中的结构化数据,在STEM领域潜力巨大。研究还提出用光学压缩模拟人类遗忘机制,探索超长上下文处理的新方向。这一创新为VLM和LLM的发展开辟了新赛道。

原文链接
本文链接:https://kx.umi6.com/article/26997.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
2025-10-21 10:24:34
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
Airwallex 空中云汇收购韩国持牌支付公司 Paynuri
2026-01-21 13:11:13
下载超 10 亿、衍生模型破 20 万,阿里千问刷新全球开源模型纪录
2026-01-21 16:18:32
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
Anthropic下调其利润率预期
2026-01-22 11:52:20
AI推理GPU芯片公司曦望完成近30亿元融资
2026-01-22 16:05:02
阿里云智能集团资深副总裁李飞飞:内存价格预计还会上涨两到三倍
2026-01-22 19:09:39
超600家上市公司预告2025年业绩 新兴产业增势亮眼
2026-01-22 06:40:59
中国团队首次在Nature子刊发布医疗AI标准,未来医生MedGPT摘得全球桂冠
2026-01-21 13:06:32
24小时热文
更多
扫一扫体验小程序