上下文压缩 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

10月22日，智谱与DeepSeek在视觉Token研究上再度‘撞车’。DeepSeek-OCR发布不到一天，智谱便开源了其视觉Token方案Glyph。两者均通过视觉方式破解LLM上下文冗长的难题。Glyph将文本渲染成图像式视觉Token，大幅压缩上下文长度，最高可实现3-4倍的Token压缩率，同时保持与主流模型相当的准确度。实验显示，Glyph在极端压缩下仍能应对百万级Token任务，并提升推理速度4倍、训练效率2倍。论文由清华大学团队完成，一作为博士生Jiale Cheng，通讯作者为黄民烈教授。视觉Token潜力巨大，DeepSeek-OCR用100个视觉Token即可达到97.3%准确率，单张A100 GPU日处理超20万页文档。未来，像素可能取代文本成为AI的基本信息单元。

原文链接