基于单目视频序列的真实人体姿态三维重建

由天下分享时间：2025/3/3 19:54:08 加入收藏我要投稿点赞

基于单目视频序列的真实人体姿态三维重建

摘要本文提出了一种基于视频的三维人体姿态重建技术，制定了基于视频的关键帧的重建框架。本文还利用牛顿物理学，关节点的生物运动约束等同时对人体姿态进行三维重建。并验证了该算法的可行性和精度。

关键词视频序列；交互式姿态跟踪；计算机视觉

中图分类号tp39 文献标识码a 文章编号 1674-6708（2011）54-0197-01 0 引言

本文提出了基于单目非标定视频的人体动作捕捉及三维重建方法，同时利用计算机视觉和基于真实物理运动学原理。本文基于图像的关键帧技术对视频进行处理：首先对关键帧进行交互式三维重建，然后进行基于图像的姿态插值，同时利用牛顿力学原理和生物约束集对重建结果进行修改和优化。 1 算法概述

首先基于用户交互式方法估计三维特征点集合和人体骨骼大小，同时用牛顿力学原理和生物约束集对重建的姿态进行评估和优化。

1.1 基于关键帧的交互式三维建模

此环节利用一种高效的算法来估计关键帧中的三维姿态，同时估计相机参数和人体骨架大小。

1.2 基于图像的三维关键帧插值

本文提出一种高效的算法自动跟踪二维图像中的特征点集，并利用图像测量技术对关键帧进行插值操作，同时可以修改并优化重建后的模型。

2基于关键帧的交互式三维建模

本文将人体分为17个刚体部分，主要包括头、颈、躯干、左右锁骨、肱骨、桡骨、胯骨、股骨、胫骨和跖骨。用关节坐标集q描述人体全部姿态，q ∈ r37 。向量l表示17段刚体部分的长度集合，l = [l1 , ..., l17]t ， lb, b = 1, ..., 17 表示第b段关节的长度。

利用以上参数可以估计k幅关键帧的三维姿态(q1 , ..., qk )以及人体骨架大小（l）。 2.1摄像头参数估计

对于移动摄像头拍摄的视频利用matchmover [2008]估计摄像头的内参数和外参数=（tx,ty,tz,θx,θy,θz, f），（tx,ty,tz）, （θx, θy, θz）和f分别表示相机坐标、方向和相机焦距。对于固定摄像头拍摄的视频用3.2中提出的算法自动估计以上参数值。 2.2交互式三维关键帧建模

本文定义了能量方程和成本方程来估计和消除二义性问题。具体来说，通过计算以下能量方程的最小值来估计人体骨架大小l和三维姿态q1,...,qk

（1）

ep代表骨骼投影约束，es表示对称约束，保证重建后的三维骨架的对称部分是等长的。er为对称约束，ec则保证在某些视频中保证部分特征点的相对坐标保持不变，ed可消除重建过程中出现的二义性。

本文用表示每段关节的内关节点和外关节点的深度信息，同时对方程式（1）进行初始化和优化操作。对于前者采用解析式的雅可比公式，对于后者则用levmar library [lourakis 2009]中的levenberg-marquardt 算法进行优化。 3 基于图像的三维关键帧插值技术 3.1 基于多关节的二维关键帧插值

下肢(包括股骨、胫骨和跖骨)的姿态可用表示，表示在2维图像中对应的关节点坐标，待估参数为，。第t帧某区域内特征向量（2）

h（et）和hm（et）分别表示在特征空间内的当前目标模型和第个密度空间。

假设任意中间帧的模板模型可参数化：

hm（βt）= βt hm（e1）+（1-βt）hm（et）, m=1, ..., m（3）

将hm (βt )和h（et）进行匹配估计骨骼姿态参数值，用巴特查利亚距离度量匹配距离：