标题:经典卡尔曼滤波器改进视频版“分割一切”,网友:好优雅的方法
Meta的视频版“分割一切”——Segment Anything Model 2(SAM 2)再度走红。这次,一个全华人团队仅用经典方法就显著提升了其性能。
改进后的SAM 2名为SAMURAI(武士),由华盛顿大学全华人研究团队提出。这项工作解决了SAM 2在记忆管理上的局限性,尤其是在快速移动或被遮挡时能持续跟踪目标。
改进的关键在于使用了经典的卡尔曼滤波器(Kalman Filter,KF),无需重新训练,即可实现实时运行。这一方法在多个复杂场景中表现出色,包括《1917》电影片段、《只狼:影逝二度》和《黑神话:悟空》中的打斗场景、橄榄球比赛及女团舞蹈。
SAMURAI的核心技术包括运动建模和运动感知记忆选择。运动建模采用卡尔曼滤波器预测目标运动,结合运动分数和掩膜亲和分数进行掩膜选择。运动感知记忆选择则通过动态评分系统筛选记忆库中的相关帧,避免引入低质量特征。
实验结果显示,SAMURAI在多个基准测试中表现优异,超越了SAM 2,并与部分有监督方法相当。这项工作的研究团队由华盛顿大学电气与计算机工程系的博士生组成,导师是Jenq-Neng Hwang教授。
更多内容可访问项目地址:https://yangchris11.github.io/samurai/ 论文地址:https://arxiv.org/abs/2411.11922 参考链接: [1] https://x.com/EHuanglu/status/1860090091269685282 [2] https://x.com/bilawalsidhu/status/1860348056916369881
原文链接
本文链接:https://kx.umi6.com/article/9196.html
转载请注明文章出处
相关推荐
换一换
经典卡尔曼滤波器改进视频版「分割一切」,网友:好优雅的方法
2024-11-24 12:44:05
中信证券:医疗健康产品销售线上化率有望迎来长足提升
2025-12-06 10:24:18
河南“十五五”规划建议:全面实施“人工智能+”行动 建设重点行业领域垂直大模型
2025-12-08 08:15:51
马斯克最新宏大设想:每年发射百万吨级的卫星来扩张 AI 算力
2025-12-08 18:40:45
科创引领新经济 数智驱动新发展——2025东方财富私募风云际会论坛盛大召开
2025-12-08 15:32:36
2025 日本国际机器人展闭幕,中国企业占据人形机器人半壁江山
2025-12-07 22:51:22
李开复:未来办公司和搭积木一样快,比谁更会用 Agent
2025-12-06 18:42:35
知名数学家辞职投身AI创业:老板是00后华人女生
2025-12-06 11:24:32
广西“十五五”规划建议:打造面向东盟开放合作高能级平台
2025-12-07 10:24:46
用 AI 合成死螃蟹视频骗退款 195 元,买家被行拘 8 日
2025-12-05 23:56:50
黄仁勋:AI末日永远不会发生
2025-12-08 10:21:57
阴和俊:在量子科技等领域布局建设未来产业 加强对国家重大科技任务和科技型企业的金融支持
2025-12-08 10:23:04
美团发布并开源 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA
2025-12-08 10:19:43
602 文章
362167 浏览
24小时热文
更多
-
2025-12-08 20:48:29 -
2025-12-08 20:47:34 -
2025-12-08 20:45:30