1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

牛津大学和谷歌研究院合作的创新项目"CLIP as RNN (CaR)"在CVPR 2024会议上亮相。CaR是一个无需额外训练的技术,能够直接分割多种概念,如电影角色、地标和品牌,即使面对开放词汇。它利用循环神经网络结构,通过CLIP模型的循环调用来生成和筛选掩码,逐步提高分割精度。

关键优势包括: 1. 不依赖额外训练数据,无需掩码注解或大量图像-文本数据。 2. 保持开放词汇能力,不受限于预训练VLM的微调。 3. 能处理文本查询中图像内不存在的概念,通过迭代优化提升分割质量。

CaR的设计灵感来源于RNN的隐状态,通过掩码提议生成器和分类器,反复评估和筛选,实现高质量的分割。研究显示,即使在零样本条件下,CaR在多项指标上也优于传统微调方法。

项目亮点在于其对复杂文本查询的处理和潜在的视频应用潜力,为开放词汇图像分割领域带来了重大突破。论文和项目详情可参考相关链接。

原文链接
本文链接:https://kx.umi6.com/article/1004.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
CLIP当RNN用入选CVPR:无需训练即可分割无数概念|牛津大学&谷歌研究院
2024-06-07 19:14:35
突发!xAI联创杨格过劳病离职,给马斯克干活压力山大
2026-01-21 17:21:29
过去一年,中国AI如何改变全球开源格局?
2026-01-22 13:56:28
重思启动重塑,美通社成功举办2026新传播年度论坛
2026-01-22 13:58:50
腾讯重仓的GPU公司要上市了!燧原科技IPO获受理,拟募资60亿
2026-01-23 14:59:46
黄仁勋:AI时代蓝领更吃香 水管工、电工能拿六位数薪水
2026-01-22 07:42:15
星凡星启:首个国产卫星算力模组落地
2026-01-23 10:51:27
腾讯视频首发AI打电话功能!看剧时能直接给主角打电话
2026-01-23 18:10:36
农业农村部:将持续推动人工智能等在农业领域应用
2026-01-22 11:51:14
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
AI初创公司Inferact完成1.5亿美元种子轮融资
2026-01-23 18:11:40
2025 年 ACM Fellow 名单公布:郑宇、梅涛、金海、陈宝权等 19 名华人学者入榜
2026-01-23 11:50:59
贝莱德CEO称人工智能领域不存在泡沫
2026-01-22 23:18:34
24小时热文
更多
扫一扫体验小程序