AI News Hub Logo

AI News Hub

HKUST(GZ) Chen Changhao Team: Using Just a Single RGB Image to Enable Machines to Understand Indoor 3D Space丨CVPR 2026

Leiphone
雷锋网

LegoOcc:无需语义体素标注,也能识别开放类别。     作者丨郑佳美     编辑丨岑   峰                                                                                                                 真正的室内空间智能,并不只是让机器认出画面里有一张桌子,而是让它理解真实三维物理空间内:哪里可以通行、哪里存在遮挡、哪些物体能够交互。 对于未来的家庭机器人和护理机器人来说,理解一个房间并不只是完成图像分类。它意味着,机器人能够根据一句自然语言找到玄关柜旁的雨伞,能够在夜间识别走廊中的充电线是否可能绊倒老人,也能够在厨房中理解台面、水杯与边缘之间的空间关系,并在陌生环境中快速建立可行动的三维空间认知。 但室内环境,恰恰是 3D 感知最难落地的场景之一。相比之下,自动驾驶虽然复杂,却仍然拥有相对稳定的道路结构与交通参与者,而室内空间更像一个持续变化的开放世界。物体摆放随时可能变化,遮挡关系更密集,许多目标并不属于数据集中预定义的类别。如果希望模型真正理解三维空间