1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

11月26日,Hugging Face 发布了名为 SmolVLM 的AI视觉语言模型,该模型仅含20亿参数,专为设备端推理设计,具备体积小、速度快、内存高效的特点。SmolVLM 完全开源,所有模型检查点、数据集、训练配方及工具均在Apache 2.0许可证下发布。该模型有三种版本:SmolVLM-Base(适用于下游微调)、SmolVLM-Synthetic(基于合成数据微调)和SmolVLM-Instruct(可用于交互式应用)。SmolVLM通过优化架构,使用SmolLM2作为语言主干,并采用像素混洗策略,将视觉信息压缩率提高到9倍,从而显著降低内存占用。在多项基准测试中,SmolVLM的预填充吞吐量比Qwen2-VL快3.3至4.5倍,生成吞吐量快7.5至16倍。这一模型有望解决大型模型在普通设备上运行缓慢的问题。

原文链接
本文链接:https://kx.umi6.com/article/9345.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025-09-01 16:20:02
微软将对AI模型的“安全性”进行排名
2025-06-09 14:28:33
DeepSeek-Prover-V2-671B 新模型开源发布
2025-04-30 19:50:58
谷歌新App来了!手机没网也能玩AI 还能画图、写代码
2025-06-02 08:30:14
在训练中给人工智能一种邪恶的“疫苗”,可能会让它变得更好
2025-08-04 20:02:39
阿里通义千问 2.5-Omni-3B AI 全模态登场:7B 版 90% 性能,显存占用减少 53%
2025-05-01 11:20:52
腾讯混元开源端到端 AI 模型 Hunyuan-Foley:视频 + 文字 =“电影级”音效
2025-08-28 13:23:33
快手发布可灵 2.0 视频生成模型及可图 2.0 图像生成模型
2025-04-15 15:33:39
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
2025-06-21 09:07:40
卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木
2025-05-09 22:57:27
美国法官裁定:Meta用书训练AI模型属“合理使用”范畴
2025-06-26 21:02:38
Adobe Firefly 上线移动平台应用:支持文生图 / 视频,可调用第三方 AI 模型
2025-06-17 22:30:24
宇树王兴兴:2025 年底,相对比较通用的人形机器人 AI 模型真的有可能诞生
2025-05-02 17:03:29
24小时热文
更多
扫一扫体验小程序