AI News Hub Logo

AI News Hub

RAM—A Novel Framework for Multi-Person 3D Human Motion Reconstruction in Complex Scenes | CVPR 2026

Leiphone
雷锋网

一、研究背景   从视频中准确理解并重建人体3D运动是计算机视觉的重要研究方向,在体育赛事分析、VR/AR、人机交互以及医疗康复等领域具有广泛应用价值。然而,在真实复杂场景中,该任务仍面临三大严峻挑战: 首先是身份关联不稳定——多人交互时,频繁的遮挡和快速运动容易导致ID Switch,影响后续重建的一致性;其次是运动轨迹中断——视角变化和极端遮挡会造成目标跟踪丢失;第三是重建结果不连续——传统逐帧处理方式难以维持时间维度上的三维结构稳定性。 传统方法通常将目标跟踪和三维重建作为两个独立的流水线模块处理,无法从整体视角利用跨帧的时序信息。RAM(Recover Any 3D Human Motion)从根本上打破了这一范式,提出统一框架将运动感知跟踪、时序建模与动作预测有机融合,实现从逐帧处理向时序建模的范式转变。  二、核心方法   RAM 框架由四个关键模块构成,各司其职、协同工作: SegFollow 模块(稳定跟踪):引入基于卡尔曼滤波的运动建模机制,将运动一致性信息融入目标关联过程。不再过度依赖外观特征,即使在严重遮挡或外观发生剧变的情况下,依然能维持稳定的身份跟踪,从根本上