基于视觉的大范围头部姿态跟踪关键技术研究

基于视觉的大范围头部姿态跟踪关键技术研究

论文摘要

三维头部姿态跟踪(3D head pose tracking)是计算机视觉和人机交互领域中的重要问题,也是近年来越来越引起重视的研究方向,其主要目的是通过对输入图像序列的分析确定头部在三维空间中的姿态参数。三维头部姿态跟踪技术在人机交互、智能监控、视频压缩编码、人脸识别、表情识别、疲劳检测、基于身体控制的游戏和娱乐等领域有广泛的应用前景。目前常用的头部姿态估计方法可以分成两大类:基于统计学习的方法和基于注册跟踪的方法。基于统计学习的方法假设头部姿态参数和人脸的某些特征之间存在一定的对应关系,并通过对大量具有不同姿态的样本图像进行训练来确定这种关系。此类方法容易受到特征定义的影响,并且往往要对姿态参数进行插值操作,因此结果不够精确。基于注册跟踪的方法通常假设头部为刚性物体,通过帧与帧之间的特征点跟踪计算姿态参数。所选择的特征在不同的实现中有很大的差异。一种方法是选择嘴角、鼻尖和眼角等显著特征点进行跟踪,当所选的特征点被遮挡时会影响跟踪结果。另一种方法是在跟踪过程中动态选择特征点,当一些特征点丢失后自动进行补充,此类方法有更鲁棒的表现。总体来说,基于注册跟踪的方法易于实现,同时具有较高的跟踪精度。已有的头部姿态跟踪算法大都假设被跟踪对象没有身体运动或者很小的身体运动,如用户坐在椅子上的情况。人们在日常生活中很多时候都是通过头部姿态来表达自己的注意力方向、态度和心理感受的,而在这些活动中,人们可能是坐在固定位置,也有可能是在身体运动过程中的。这里我们定义身体运动情况下的头部姿态跟踪为大范围头部姿态跟踪。相对于传统的小范围头部姿态跟踪技术,大范围头部姿态跟踪技术可以更方便的应用在人机交互、智能监控和行为识别等多个领域。本文选用基于注册的方法来解决大范围头部姿态跟踪问题,但是当人体大范围运动时,过大的姿态参数变化会降低注册算法的精度,逐帧跟踪的方法在长时间跟踪后会导致一定的误差累计,并且为了进行三维姿态参数计算,还需要提供对应头部特征点的深度信息。因此,本文提出基于局部特征描述符的注册算法和视角表观模型相结合的跟踪方法,该方法将整个姿态跟踪过程分为三个主要部分:一是获取视频信息和对应的深度信息,深度信息既可以使用立体摄像机获得也可以通过立体匹配技术获得;二是通过基于局部描述符的注册算法计算两帧之间的姿态参数变化;三是使用外观模型消除跟踪过程中的误差累计。与以前的工作相比,本文主要有以下几个方面的贡献:1.提出一种基于尺度不变特征变换(Scale-Invariant Feature Transform,以下简称SIFT)描述符的注册算法。首先在两帧灰度图像中找到匹配的SIFT特征点,然后通过立体摄像机或者立体匹配技术获得这些匹配点的深度信息,为了克服错误匹配点的影响,最后使用基于随机抽样一致性(RANSAC)的运动估计方法来计算头部运动。基于SIFT特征匹配的注册算法具有较高的跟踪精度,当两帧图像间发生一定尺度变化时仍然可以完成跟踪,是一种适合大范围头部姿态跟踪的注册算法。该算法是第一个针对大范围头部姿态跟踪提出的注册算法,在领域内产生了一定的影响,我们发表的介绍该算法的文章已被多个国际同行引用。2.提出一种紧凑的特征描述符KPB-SIFT(Kernel Projection Based SIFT,以下简称KPB-SIFT)。首先使用SIFT检测算法计算特征点的位置、尺度和主方向,然后通过对特征点邻域内的有向梯度信息进行核映射的方式获得低维描述符。与SIFT相比,KPB-SIFT可显著提高描述符的匹配速度,并且具有较强的区分度,在发生光照变化和几何形变等情况下都有鲁棒的表现。3.提出一种视角表观模型。该模型通过多次注册的方法消除逐帧跟踪时的误差累计,其原理就是当前帧除了和它的前一帧进行注册外,还可以和一两个关键帧进行多次注册以减少误差累积。具体来说,就是从输入序列中选择一些关键帧组成描述头部的表观模型,每个关键帧都被附加上对应的姿态参数,除此外还对每个关键帧精确提取头部区域作为头部视角,当被跟踪对象大范围运动时,只要当前帧的头部视角与模型中的关键帧头部视角接近时,当前帧就与关键帧进行注册。多次注册的结果通过卡尔曼滤波器(Kalman filter)进行平滑已获得最终的姿态参数。视角表观模型不仅可以减少跟踪过程中的误差累计,在头部进出摄像机视角、头部离摄像机较远等情况下,视角表观模型还可以用来快速恢复头部姿态参数。4.提出一种适合稠密立体匹配的快速局部特征描述符(Speeded-Up LocalDescriptor,以下简称SULD),用来作为立体匹配过程中的对应点查找方法。为了生成局部描述符,首先使用哈尔(Haar)函数对图像进行滤波,其次对滤波响应图进行多次高斯平滑,然后计算采样点并获得采样向量,最后对采样向量进行归一化并生成描述符。通过使用Haar函数响应信息和紧凑的描述符形式,SULD方法在描述符生成阶段和匹配阶段都可以快速的进行计算。使用SULD描述符作为相似度评价方法,可以解决人脸等弱纹理图像的立体匹配问题,进而生成对应的深度信息,为基于单目摄像机的头部姿态跟踪提供深度约束。头部深度信息还可以在人机交互、表情识别、游戏和娱乐等领域得到广泛的应用。在整个研究过程中,还实现了一个集视频采集、深度获取、姿态计算和结果评测与一体的头部姿态跟踪原型系统-HPObserver。HPObserver为验证各关键技术和后续研究工作提供了一个完整方便的测试平台。使用多组头部运动序列进行的实验表明,提出的方法能完成对头部运动的跟踪,即使在人体大范围运动、头部进出摄像机视角、人脸部分遮挡、脸部表情明显变化等情况下都能鲁棒的完成跟踪。在本文最后,分析了提出方法的主要问题并展望了未来的研究方向。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 头部姿态跟踪简介
  • 1.2 头部姿态跟踪的应用
  • 1.3 大范围头部姿态跟踪
  • 1.3.1 头部姿态估计方法简介
  • 1.3.2 大范围头部姿态跟踪
  • 1.3.3 大范围头部姿态跟踪的主要困难
  • 1.3.4 大范围头部姿态跟踪的关键技术问题
  • 1.3.5 大范围头部姿态跟踪的技术路线
  • 1.4 论文的主要工作
  • 1.5 论文的结构
  • 第2章 基于视觉的头部姿态估计方法概述
  • 2.1 国内外研究现状
  • 2.2 基于统计学习的方法
  • 2.2.1 基于模板匹配的方法
  • 2.2.2 基于多个分类器的方法
  • 2.2.3 基于神经网络的方法
  • 2.2.4 基于特征空间的方法
  • 2.2.5 基于柔性模型的方法
  • 2.2.6 基于几何关系的方法
  • 2.2.7 小结
  • 2.3 基于注册跟踪的方法
  • 2.3.1 基于立体视觉的方法
  • 2.3.2 基于单目视觉的方法
  • 2.3.3 小结
  • 2.4 结论
  • 第3章 头部姿态跟踪相关背景知识
  • 3.1 摄像机透视投影模型
  • 3.1.1 齐次坐标
  • 3.1.2 透视模型成像
  • 3.1.3 使用齐次坐标表示的投影映射
  • 3.1.4 摄像机的旋转和平移
  • 3.2 头部的旋转运动表示
  • 3.3 双视角几何
  • 3.3.1 基本矩阵
  • 3.4 Digiclops立体摄像机的原理
  • 3.5 结论
  • 第4章 基于特征描述符的注册算法
  • 4.1 SIFT简介
  • 4.1.1 尺度变换空间中的极值点检测
  • 4.1.2 特征点筛选和定位
  • 4.1.3 主方向确定
  • 4.1.4 SIFT描述符生成
  • 4.2 基于特征匹配的注册算法
  • 4.2.1 SIFT特征匹配
  • 4.2.2 使用立体摄像机跟踪时的注册算法
  • 4.2.3 使用单目摄像机跟踪时的注册算法
  • 4.2.4 实验结果与分析
  • 4.3 基于核映射的描述符降维方法
  • 4.3.1 基于核映射的局部描述符
  • 4.3.2 实验结果与分析
  • 4.4 结论
  • 第5章 基于视角表观模型的误差累积消除
  • 5.1 视角表观模型
  • 5.1.1 基准帧选择
  • 5.1.2 基于描述符注册算法的误差
  • 5.1.3 姿态参数更新
  • 5.1.4 关键帧调整
  • 5.1.5 多尺度视角表观模型
  • 5.2 使用视角表观模型快速恢复头部姿态参数
  • 5.2.1 参照帧选择
  • 5.2.2 姿态参数调整
  • 5.3 实验结果与分析
  • 5.3.1 参数设置
  • 5.3.2 使用视角表观模型的头部姿态跟踪实验
  • 5.3.3 使用视角表观模型的头部姿态恢复实验
  • 5.4 结论
  • 第6章 基于单目摄像机的深度信息获取
  • 6.1 立体匹配技术简介
  • 6.1.1 立体匹配的基本步骤
  • 6.1.2 局部描述符在立体匹配中的应用
  • 6.2 局部描述符SULD
  • 6.2.1 计算Haar函数响应
  • 6.2.2 平滑响应图
  • 6.2.3 描述符的生成
  • 6.2.4 计算复杂度
  • 6.2.5 使用SULD描述符生成深度信息
  • 6.3 实验结果与分析
  • 6.3.1 参数设置
  • 6.3.2 基于立体匹配的深度信息获取实验
  • 6.3.3 采样点分布和描述符归一化方法测试
  • 6.3.4 SULD与DAISY的速度对比实验
  • 6.4 结论
  • 第7章 HPObserver-基于视觉的头部姿态跟踪原型系统
  • 7.1 系统结构概述
  • 7.2 系统模块介绍
  • 7.2.1 正面人脸检测
  • 7.2.2 头部位置检测
  • 7.2.3 运动感知传感器pciBIRD
  • 7.3 系统实现
  • 7.4 基于头部姿态跟踪的虚拟场景漫游
  • 7.5 结论
  • 第8章 总结和展望
  • 8.1 总结
  • 8.2 展望
  • 参考文献
  • 攻读博士学位期间主要的研究成果
  • 致谢
  • 相关论文文献

    • [1].航天器编队飞行多目标姿态跟踪终端滑模控制[J]. 空间控制技术与应用 2010(05)
    • [2].基于模型参考自适应滑模技术的姿态跟踪控制[J]. 上海航天 2014(04)
    • [3].交会对接模拟系统姿态跟踪有限时间抗干扰控制[J]. 控制与决策 2017(07)
    • [4].视频卫星凝视姿态跟踪有限时间控制仿真研究[J]. 系统仿真学报 2016(01)
    • [5].考虑姿态禁忌约束的航天器安全姿态跟踪控制[J]. 系统工程与电子技术 2013(03)
    • [6].基于非线性观测器的非合作目标姿态跟踪控制[J]. 空间控制技术与应用 2013(05)
    • [7].抓捕航天器的多环递归姿态跟踪控制[J]. 航天控制 2018(01)
    • [8].基于加速度传感器的人体姿态跟踪角度算法[J]. 湖北工业大学学报 2011(04)
    • [9].参数不确定挠性航天器的姿态跟踪控制[J]. 航天控制 2010(03)
    • [10].光学头部姿态跟踪的多传感器数据融合研究[J]. 自动化学报 2010(09)
    • [11].基于本征旋转的刚体姿态跟踪系统滑模控制器[J]. 北京航空航天大学学报 2010(06)
    • [12].基于归一化神经网络的航天器自适应姿态跟踪控制[J]. 宇航学报 2010(11)
    • [13].基于ARM的嵌入式手姿态跟踪设备控制系统研究[J]. 新技术新工艺 2009(08)
    • [14].基于多特征融合的分块采样粒子滤波算法在人体姿态跟踪中的应用[J]. 计算机研究与发展 2011(12)
    • [15].大型平台的惯性稳定与地理坐标系姿态跟踪[J]. 导航与控制 2017(03)
    • [16].基于时变增益ESO的航天器无源姿态跟踪控制[J]. 控制与决策 2018(02)
    • [17].无角速度测量的姿态跟踪动态PD控制[J]. 电机与控制学报 2017(12)
    • [18].基于误差四元数分解的刚体姿态跟踪滑模控制[J]. 中国空间科学技术 2009(04)
    • [19].卫星姿态跟踪的间接自适应模糊预测控制[J]. 系统科学与数学 2009(10)
    • [20].可重复使用飞行器再入姿态的区间二型自适应模糊滑模控制设计[J]. 北京航空航天大学学报 2020(04)
    • [21].改变系统结构的多环姿态跟踪控制[J]. 火力与指挥控制 2019(09)
    • [22].高超声速飞行器姿态跟踪鲁棒自适应控制[J]. 电机与控制学报 2018(07)
    • [23].带微分观测器的双环姿态跟踪控制[J]. 北京理工大学学报 2018(10)
    • [24].基于终端滑模和神经网络的多目标姿态跟踪鲁棒控制[J]. 空间控制技术与应用 2019(03)
    • [25].航天器抓捕非合作目标的快速姿态跟踪控制[J]. 控制工程 2017(08)
    • [26].基于特征点的3D人脸姿态跟踪[J]. 电子测量与仪器学报 2016(04)
    • [27].基于反步法的航天器有限时间姿态跟踪容错控制[J]. 航空学报 2015(06)
    • [28].挠性航天器预设性能自适应姿态跟踪控制[J]. 哈尔滨工业大学学报 2018(04)
    • [29].考虑未知飞轮摩擦力矩的航天器姿态跟踪鲁棒自适应控制[J]. 宇航学报 2016(02)
    • [30].基于数据融合的座舱头部姿态跟踪方法研究[J]. 电光与控制 2016(08)

    标签:;  ;  ;  ;  ;  ;  

    基于视觉的大范围头部姿态跟踪关键技术研究
    下载Doc文档

    猜你喜欢