2025年10月,DeepSeek开源新模型DeepSeek-OCR,引发硅谷热议。该模型通过二维视觉压缩一维文字,显著降低大模型处理长文本的算力需求。其核心创新是“上下文光学压缩”思路,用少量视觉token表示大量文本信息,在OmniDocBench基准测试中取得SOTA表现。例如,仅用100个视觉token即可超越GOT-OCR2.0。模型由编码器DeepEncoder和解码器DeepSeek3B-MoE-A570M组成,支持多种压缩模式,适用于复杂文档解析。研究团队还提出模拟人类遗忘机制的新思路,动态分配计算资源以优化超长上下文处理能力。目前,项目已在GitHub获3.3K星,HuggingFace热榜排名第二。
原文链接
本文链接:https://kx.umi6.com/article/27003.html
转载请注明文章出处
相关推荐
换一换
超长视频理解难平衡性能和效率
2024-10-28 17:57:47
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
2025-10-21 10:24:34
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
机构:2026年全球800G以上光收发模块达近6300万组
2025-12-08 17:39:25
豆包手机助手:已下线操作银行、互联网支付类APP的能力
2025-12-06 18:44:32
OpenAI:科技、医疗和制造业是人工智能增长最快的行业
2025-12-08 20:47:34
联想入股原力聚合机器人科技公司
2025-12-08 11:27:54
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
特斯拉 Optimus 人形机器人演示时摔倒,手忙脚乱“摘头显”露了馅
2025-12-08 15:33:43
624 文章
364864 浏览
24小时热文
更多
-
2025-12-08 21:51:18 -
2025-12-08 21:49:12 -
2025-12-08 21:48:42