1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:RAM——复杂场景下多人3D人体运动重建新框架 | CVPR 2026

正文:
从视频中重建人体3D运动是计算机视觉的重要方向,广泛应用于体育分析、VR/AR、人机交互和医疗康复等领域。然而,在复杂场景中,这一任务面临三大挑战:身份关联不稳定(频繁遮挡导致ID切换)、运动轨迹中断(视角变化或遮挡造成跟踪丢失)以及重建结果不连续(逐帧处理难以维持时间维度稳定性)。针对这些问题,北京理工大学联合华盛顿大学、安徽大学等机构提出了一种新方法RAM(Recover Any Motion),相关论文《RAM: Recover Any 3D Human Motion in-the-Wild》已被CVPR 2026接收。

RAM框架包含四个核心模块:
1. SegFollow模块:基于卡尔曼滤波的运动建模机制,减少对外观特征的依赖,即使在严重遮挡或外观剧变时也能保持稳定的身份跟踪,降低ID切换率。
2. T-HMR模块:利用时间记忆机制和Transformer结构,从邻近帧中提取关键特征进行跨时间信息融合,生成平滑且一致的3D人体结构,解决重建不连续问题。
3. 动作预测模块:基于历史运动序列预测未来姿态,尤其在目标完全遮挡时,通过预测维持运动序列的连续性。
4. 自适应融合模块:动态调整当前帧重建结果与预测结果的权重,根据信息可靠性实现最优融合。

亮点总结:
1. RAM首次将目标跟踪、时序三维重建与动作预测整合到统一框架,充分利用跨帧时序信息,突破传统流水线局限。
2. 在PoseTrack等复杂场景数据集上,RAM展现出强大的零样本泛化能力,无需额外训练即可显著超越现有方法。
3. 引入时间记忆与动作预测机制,使模型更接近人类动态认知过程,为视频理解领域提供了重要启示。

原文链接:https://arxiv.org/abs/2603.19929
解读来源:https://cloud.tencent.com/developer/article/2658222

原文链接
本文链接:https://kx.umi6.com/article/35165.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中山大学郭裕兰团队:数据充足却训练失败,多智能体到底卡在哪丨CVPR 2026
2026-04-22 16:18:49
演员开始被批量淘汰 但他们的脸连一天工资都不值
2026-04-23 06:50:57
谷歌云推出7.5亿美元基金 助力合作伙伴加速智能体人工智能开发
2026-04-22 20:29:22
寒武纪回应互联网大厂自研芯片影响:公司产品对各类人工智能技术具备较好普适性
2026-04-22 15:25:07
天孚通信:1.6T光引擎处于量产状态目前因为个别物料缺料尚未达到预期产量 公司在积极协调供应商努力争取更多交付
2026-04-22 19:25:59
特斯拉:Cortex 2算力集群现已上线 并已开始运行训练任务
2026-04-23 08:58:08
广东:引导智算中心集群化发展、集约化建设 积极谋划省级“智算池”
2026-04-22 17:31:23
行业景气度高位运行 光模块企业扩产忙
2026-04-23 07:55:30
漫展误用AI元素 长虹电视道歉:立即下架重绘
2026-04-24 06:55:41
OpenAI正式发布GPT-5.5
2026-04-24 09:02:17
特斯拉CEO马斯克:预计未来AI芯片将严重不足
2026-04-23 11:06:01
谷歌云与CVC达成合作 加速智能体AI转型
2026-04-23 20:28:51
国内首家百亿估值纯推理GPU独角兽诞生!专访曦望联席CEO王湛:谁的推理成本更低谁就是赢家
2026-04-23 23:33:29
24小时热文
更多
扫一扫体验小程序