DeepSeek新模型被硅谷夸疯了！“谷歌核心机密被开源”

2025-10-21 10:24:34

DreamCoder

发布在

快讯

阅读：784

2025年10月，DeepSeek开源新模型DeepSeek-OCR，引发硅谷热议。该模型以3B参数规模，通过“视觉压缩文本”方法解决大模型处理长文本的算力难题，被认为可能泄露谷歌Gemini商业机密。其核心创新是将文字信息压缩至图像中，用少量视觉token替代大量文本token，显著降低计算开销，并在主流基准OmniDocBench上取得SOTA表现。模型支持多种复杂文档解析，如金融报表、化学分子式等。研究团队由Haoran Wei等三位成员组成，他们还提出模拟人类遗忘机制的新思路，为AI记忆架构提供新方向。目前，该模型已在GitHub获3.3K星，HuggingFace热榜第二，受到卡帕西等专家高度评价。

原文链接

本文链接：https://kx.umi6.com/article/27018.html

转载请注明文章出处

DeepSeek-OCR