2025年10月22日,DeepSeek发布新模型DeepSeek-OCR,革新了信息存储方式。该模型通过将大量文字压缩成图片形式,实现用更少的视觉token记住更多信息,仅需100个token即可超越传统模型256个token的效果,不到800个token便击败需6000+token的竞品。DeepSeek-OCR支持多种分辨率与动态调整模式,可识别并存储图片中的表格、分子结构等复杂数据,同时保留图片位置及上下文信息。此外,模型大幅降低计算资源消耗,以1/10的token数量保持96.5%的准确率,并引入类似人类遗忘机制的分级存储方式。研究基于华为、百度、Meta及OpenAI等开源成果,展现了全球协作的力量。目前,DeepSeek-OCR已开源,未来应用前景广阔。
原文链接
本文链接:https://kx.umi6.com/article/27086.html
转载请注明文章出处
相关推荐
换一换
抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT-4o
2025-10-14 12:13:47
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
2025-07-23 09:45:56
小红书开源首个大模型 预训练未使用合成数据
2025-06-10 09:46:30
腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统
2025-08-01 09:00:10
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
蚂蚁发布并开源万亿参数思考模型Ring-1T
2025-10-14 17:25:02
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
2025-07-26 11:37:17
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
2025-07-23 08:44:56
AMD甩出最猛两代AI芯片,算力飙涨、豪气堆料
2025-06-13 12:08:30
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
三家混战,大模型重回2023
2025-08-03 11:35:50
581 文章
342470 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30