Hugging Face于1月26日发布了两款多模态模型SmolVLM-256M和SmolVLM-500M,其中SmolVLM-256M号称是世界上最小的视觉语言模型。这些模型基于80B参数模型蒸馏而成,在性能和资源需求间实现平衡。SmolVLM-256M采用SigLIP作为图片编码器,SmolLM2作为文本编码器,可在移动平台轻松运行,仅需不到1GB GPU显存即可完成单张图片推理。SmolVLM-500M则针对高性能场景设计,推理单张图片需1.23GB GPU显存,输出内容更精准。两款模型均采用Apache 2.0开源授权,提供基于transformer和WebGUI的示例程序,供开发者下载和使用。
原文链接
本文链接:https://kx.umi6.com/article/12213.html
转载请注明文章出处
相关推荐
换一换
Hugging Face 称其开源机器人模型 SmolVLA 效率极高,能在苹果 MacBook 上运行
2025-06-05 08:43:18
ModernBERT 模型公布,接任“Hugging Face 下载榜第二”2018 年经典原版
2024-12-29 15:54:12
马斯克擎天柱大将跳槽,在抱抱脸开源机器人技术:会做家务的大白
2024-06-09 16:10:40
再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
2025-01-28 22:54:35
业界首个:英伟达发布专注于自动驾驶的视觉语言动作模型 Alpamayo-R1
2025-12-02 07:58:16
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
2025-06-09 18:31:59
大模型破译甲骨文创下新 SOTA,复旦团队推出新框架
2025-09-08 14:00:34
太可怕了!AI大模型已学会人类空间思考能力
2025-06-22 22:18:27
Hugging Face 最小 AI 视觉语言模型登场:2.56 亿参数,内存低于 1GB PC 也能驾驭
2025-01-24 11:41:33
阿里千问与DeepSeek入选全球AI开源贡献榜前十
2025-06-12 18:42:16
9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源
2025-07-02 13:05:58
世界最大开源 AI 社区 Hugging Face 曝安全漏洞:部分用户密钥泄露
2024-06-03 09:56:35
阿里万相大模型登上全球开源榜首
2025-03-03 10:23:01
742 文章
595331 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17