2025年10月,DeepSeek开源新模型DeepSeek-OCR,引发硅谷热议。该模型以3B参数规模,通过“视觉压缩文本”方法解决大模型处理长文本的算力难题,被认为可能泄露谷歌Gemini商业机密。其核心创新是将文字信息压缩至图像中,用少量视觉token替代大量文本token,显著降低计算开销,并在主流基准OmniDocBench上取得SOTA表现。模型支持多种复杂文档解析,如金融报表、化学分子式等。研究团队由Haoran Wei等三位成员组成,他们还提出模拟人类遗忘机制的新思路,为AI记忆架构提供新方向。目前,该模型已在GitHub获3.3K星,HuggingFace热榜第二,受到卡帕西等专家高度评价。
原文链接
本文链接:https://kx.umi6.com/article/27018.html
转载请注明文章出处
相关推荐
.png)
换一换
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
2025-10-20 17:10:44
DeepSeek新模型被硅谷夸疯了!“谷歌核心机密被开源”
2025-10-21 10:24:34
超长视频理解难平衡性能和效率
2024-10-28 17:57:47
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
2025-10-21 08:19:45
DeepSeek又发新模型,小而美玩出新高度
2025-10-20 21:14:11
浙江:到2030年智能体应用普及率超90% 基本形成智能经济和智能社会新形态
2025-10-21 14:31:55
北京高级别自动驾驶示范区打造“数据拼车”众源共享新范式
2025-10-21 01:15:52
拍个照就能测秃头等级?蚂蚁这AI医疗App我体验了一下
2025-10-21 12:24:41
Anthropic宣布推出Claude for Life Sciences
2025-10-21 11:25:02
几乎都在挂羊头卖狗肉!AI Agent泡沫实在太大了
2025-10-20 11:04:42
70亿,阿里香港买楼了
2025-10-20 17:10:09
宇树最新机器人发布:1米8大高个,能跳舞会功夫,就是颜值……
2025-10-20 19:12:22
滴滴自动驾驶参加智能网联汽车大会,为会议提供接驳服务
2025-10-20 13:05:38
588 文章
277165 浏览
24小时热文
更多

-
2025-10-21 16:32:23
-
2025-10-21 16:31:32
-
2025-10-21 16:31:08