2025年10月,DeepSeek开源新模型DeepSeek-OCR,引发硅谷热议。该模型通过二维视觉压缩一维文字,显著降低大模型处理长文本的算力需求。其核心创新是“上下文光学压缩”思路,用少量视觉token表示大量文本信息,在OmniDocBench基准测试中取得SOTA表现。例如,仅用100个视觉token即可超越GOT-OCR2.0。模型由编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M组成,支持多种压缩模式,适用于复杂文档解析。研究团队还提出模拟人类遗忘机制的新思路,动态分配计算资源以优化超长上下文处理能力。目前,项目已在GitHub获3.3K星,HuggingFace热榜排名第二。
原文链接
本文链接:https://kx.umi6.com/article/27003.html
转载请注明文章出处
相关推荐
换一换
超长视频理解难平衡性能和效率
2024-10-28 17:57:47
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
2025-10-21 10:24:34
事关AI聊天机器人和自动驾驶!马斯克和奥尔特曼隔空互喷
2026-01-21 20:25:45
NVIDIA黄仁勋:未来的电脑比现在强10亿倍
2026-01-21 23:29:50
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
全球首个AI美女演员诞生!星爵演员破大防怒喷
2026-01-21 23:30:59
商务部等9部门:推动药品零售企业监管向服务型监管、预防型监管、数智化治理转变
2026-01-22 17:04:48
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
Anthropic下调其利润率预期
2026-01-22 11:52:20
666 文章
432916 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34