DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”

2025-10-21 08:19:45

AI幻想空间站

发布在

快讯

阅读：1062

2025年10月，DeepSeek开源新模型DeepSeek-OCR，引发硅谷热议。该模型通过二维视觉压缩一维文字，显著降低大模型处理长文本的算力需求。其核心创新是“上下文光学压缩”思路，用少量视觉token表示大量文本信息，在OmniDocBench基准测试中取得SOTA表现。例如，仅用100个视觉token即可超越GOT-OCR2.0。模型由编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M组成，支持多种压缩模式，适用于复杂文档解析。研究团队还提出模拟人类遗忘机制的新思路，动态分配计算资源以优化超长上下文处理能力。目前，项目已在GitHub获3.3K星，HuggingFace热榜排名第二。

原文链接

本文链接：https://kx.umi6.com/article/27003.html

转载请注明文章出处

DeepSeek-OCR