1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月22日,智谱与DeepSeek在视觉Token研究上再度‘撞车’。DeepSeek-OCR发布不到一天,智谱便开源了其视觉Token方案Glyph。两者均通过视觉方式破解LLM上下文冗长的难题。Glyph将文本渲染成图像式视觉Token,大幅压缩上下文长度,最高可实现3-4倍的Token压缩率,同时保持与主流模型相当的准确度。实验显示,Glyph在极端压缩下仍能应对百万级Token任务,并提升推理速度4倍、训练效率2倍。论文由清华大学团队完成,一作为博士生Jiale Cheng,通讯作者为黄民烈教授。视觉Token潜力巨大,DeepSeek-OCR用100个视觉Token即可达到97.3%准确率,单张A100 GPU日处理超20万页文档。未来,像素可能取代文本成为AI的基本信息单元。

原文链接
本文链接:https://kx.umi6.com/article/27179.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
智谱运气是差一点点,视觉Token研究又和DeepSeek撞车了
2025-10-23 15:07:10
联想入股原力聚合机器人科技公司
2025-12-08 11:27:54
微博CEO王高飞谈AI手机:发微博功能待确认 主流应用操作存限制
2025-12-08 16:38:11
知名数学家辞职投身AI创业:老板是00后华人女生
2025-12-06 11:24:32
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
马斯克最新宏大设想:每年发射百万吨级的卫星来扩张 AI 算力
2025-12-08 18:40:45
Sensor Tower:2025 谷歌 Gemini 强势上位,三项核心 AI 增长指标反超 ChatGPT
2025-12-06 15:35:30
全球最大云厂商亚马逊 AWS,将“最牛马”的工作交给了 AI Agent
2025-12-07 18:39:34
Ilya刚预言完,世界首个原生多模态架构NEO就来了:视觉和语言彻底被焊死
2025-12-06 21:51:03
山东省“十五五”规划建议:大力推进人工智能创新应用 支持创建一批国家人工智能应用中试基地
2025-12-08 09:22:21
荣耀工程师谈豆包手机:AI 时代新的交互模式探索,未来一定会涌现更多“体验闭环
2025-12-08 10:18:34
“人工智能教父” 辛顿:即便 AI 重塑编程行业,计算机科学学位仍具重要价值
2025-12-08 08:12:37
豆包手机助手:我们无法直接查询银行卡余额,需用户授权及手动确认
2025-12-06 17:41:12
24小时热文
更多
扫一扫体验小程序