[论文翻译]多人三维姿态与形状估计:基于逆向运动学与优化的方法
摘要:从单目RGB图像中以网格形式估计3D姿态和形状具有挑战性。显然,这比仅以骨架或热图形式估计3D姿态更为困难。当涉及交互人物时,由于人物间遮挡引入的歧义性,3D网格重建变得更加困难。为应对这些挑战,我们提出了一种由粗到精的流程,该流程受益于:1) 基于抗遮挡3D骨架估计的逆向运动学;2) 基于Transformer的关系感知细化技术。在我们的流程中,首先从RGB图像中获取多人抗遮挡3D骨架,然后应用逆向运动学将估计的骨架转换为可变形3D网格参数,最后采用基于Transformer的网格细化方法,该技术通过考虑3D网格的人物内和人物间关系来优化获得的网格参数。通过大量实验,我们在3DPW、MuPoTS和AGORA数据集上验证了本方法的有效性,其性能优于现有技术。