4月24日,Meta公司发布WebSSL系列模型,参数规模3亿至70亿,基于纯图像数据训练,旨在探索无语言监督的视觉自监督学习潜力。WebSSL模型在Hugging Face平台上发布,采用DINO和Vision Transformer架构,仅使用MetaCLIP数据集的20亿张图像子集训练,排除语言监督影响。实验显示,WebSSL在OCR和图表任务中表现优异,尤其在OCR和ChartQA任务中超越CLIP达13.6%。随着参数规模增加,WebSSL在VQA任务上的表现呈近似对数线性提升,而CLIP在超30亿参数后趋于饱和。此外,WebSSL在传统基准测试中表现强劲,部分场景优于MetaCLIP和DINOv2。
原文链接
本文链接:https://kx.umi6.com/article/17738.html
转载请注明文章出处
相关推荐
换一换
Meta 签约多家媒体,为 Meta AI 聊天机器人带来更多新闻内容
2025-12-08 12:27:32
打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源
2025-11-11 18:20:16
近300亿美元!Meta即将落实创纪录私人融资交易支持数据中心建设
2025-10-17 16:29:28
Meta Facebook 新增 AI 拼贴照片编辑功能引隐私争议,用户利用平台工具修图即被视为训练素材
2025-10-18 07:29:23
坚信世界模型才是未来!Meta首席AI科学家杨立昆官宣将离职
2025-11-20 10:20:53
Meta「缅北化」?
2025-11-13 10:54:30
收购「Manus」也治不好大厂的焦虑症
2026-01-06 19:24:45
Meta公开抄阿里Qwen作业,还闭源了…
2025-12-11 12:47:10
Meta 推出 Vibes 短视频应用,平台所有内容均为 AI 生成
2025-09-27 15:43:18
Meta元宇宙部门狂裁千人
2026-01-16 15:40:05
小甜甜变牛夫人,消息称扎克伯格将削减至多三成 Meta 元宇宙项目预算
2025-12-04 22:49:46
Meta 收购 Manus 细节曝光,开价 20 亿美元闪电成交
2025-12-31 16:29:56
营收狂飙的「暗面」:Meta 成「全球欺诈大本营」?
2025-11-13 10:55:40
666 文章
502811 浏览
24小时热文
更多
-
2026-04-25 00:42:43 -
2026-04-24 23:43:31 -
2026-04-24 23:42:26