基于图像拼接的视频编辑

基于图像拼接的视频编辑

论文摘要

随着电子信息产业的发展和技术进步,能够获取、记录视频信息的设备如摄像机,摄像头等日益普及,并随之产生大量原始视频数据。如何有效的利用计算机对这些视频进行检索和再编辑引起了研究者的广泛注意。由于视频是由一系列相互联系的图像帧构成,要达到让计算机自动处理视频的目的,必须建立起不同图像帧之间的联系,随之产生的图像匹配分割问题是视觉和图像处理领域的热点和难点之一。考虑到视频场景的内在联系,本文提出了通过构造视频的全景图,利用手工与计算机相结合的方法对全景图进行编辑,实现对视频内容的再编辑。建立全景图需要完成运动参数估计,运动物体分割,图像拼接等计算过程。而在拼接完成的全景图上对视频内容进行编辑将变得简单有效并且易于实现。本文依次研究建立全景图过程中的主要技术问题,并给出在全景图基础上对视频进行编辑的具体方法。实现视频全景图拼接的第一步是对摄像机运动参数的求解并建立视频中各帧图像之间的关系以及二维图像与三维空间对应关系。本文第二章对此问题进行了详细讨论,提出利用各帧图像的Harris角点特征,进行匹配,建立起对应关系,并采用RANSAC对匹配的结果进行投票选择来保证匹配结果的鲁棒性和准确性的方法。利用匹配结果,可以求出各帧图像间的透视变换矩阵和摄像机拍摄时的内外参数。由于视频序列中可能会有运动物体存在,这会对全景图拼接过程产生干扰。本文第三章研究了当视频中的运动物体有较大范围的运动时,对其进行分割的方法。本文提出一种两步算法,首先利用帧差法(Frame difference)来快速定位运动物体的位置,之后利用均值偏移法(Mean-Shift)准确估计运动物体的边缘并利用图切割(Graph-Cut)方法建立两者之间联系。考虑到视频的运动连续性,本文同时引入前一帧分割结果来约束当前帧的分割。该算法同时利用了帧差法,均值偏移法的优点,能够快速准确的分割在视频场景中出现的运动物体。得到运动参数和运动物体分割结果之后,可从视频帧中合成全景图,本文第四章讨论了二种图像拼接采用的模型:平面投影模型和柱面投影模型。柱面投影模型假设摄像机的光心固定,摄像机在同一平面内转动。实际视频拼接过程中,经常会有因为手持摄像机转动时出现的光轴倾斜而导致拼接后的图像发生卷曲的现象。对此,本文给出了一个求柱面投影时圆柱最佳中心轴,来抵消卷曲的解决方案。同时,考虑到在摄像机运动过程中由于光照的影响,成像时白平衡和曝光补偿量不同而导致图像颜色不一致的情况,本文给出了利用有效对应点的直方图匹配求出图像的校正参数,对视频各帧图像进行颜色校正的解决方法。与传统方法相比,该方法可以消除错误对应点对校正参数带来的影响。得到视频全景图后就将视频序列转变成了全景图表示。因此,对视频进行编辑包含对全景图像进行编辑的过程。本文第五章讨论比较并改进了三种图像编辑方法:手工交互图像移植(healing brush)、平滑图像半自动修复(In-painting)和纹理图像半自动恢复(texture synthesis)。其中第一种算法适用于为修改区域指定填充信息。第二种算法适用于编辑和修复平滑区域或者比较窄的带状区域,第三种算法适用于普通或者含有纹理的图像区域。本文改进了平滑图像修复算法,使之可以实时实现。同时对于纹理图像的编辑算法,定义了新的距离度量,减小其对颜色的依赖性。文中进行的实验证明了算法的有效性。本文第六章给出了在得到全景图后,实际进行视频编辑方法的三种应用:运动全景图生成、视频中运动物体的去除、视频图像的修复与编辑。在实际处理视频的过程中,可能会遇到视频抖动及运动补偿导致的黑边等问题。针对这些具体问题,本文分别讨论了相应的算法和解决方案,并给出了实验结果。最后,在第七章中对全文的工作做一小结并对今后可能的后续工作进行了展望。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 视频编辑及研究进展
  • 1.2.1 摄像机标定
  • 1.2.2 视频中运动物体分割
  • 1.2.3 视频图像的拼接
  • 1.2.4 图像编辑
  • 1.3 本文主要创新点和各章内容介绍
  • 1.3.1 本文的创新点
  • 1.3.2 本文内容安排
  • 第二章 摄像机标定
  • 2.1 摄像机成像模型及其参数
  • 2.2 图像匹配及平面投影
  • 2.2.1 块匹配
  • 2.2.2 特征点匹配
  • 2.3 摄像机标定
  • 2.3.1 求摄像机焦距
  • 2.3.2 摄像机外部参数
  • 2.4 本章小结
  • 第三章 运动物体分割
  • 3.1 帧差法估计运动物体区域
  • 3.2 基于色彩的区域分割
  • 3.2.1 分割的度量
  • 3.2.2 颜色空间转化
  • 3.2.3 均值偏移分割算法
  • 3.3 图切割分割算法
  • 3.3.1 建立能量方程
  • 3.3.2 图切割方法求解
  • 3.4 实验结果
  • 3.5 本章小结
  • 第四章 全景图拼接
  • 4.1 平面投影拼接
  • 4.1.1 投影矩阵计算
  • 4.1.2 全景图大小估计
  • 4.1.3 全景图计算
  • 4.1.4 运动物体的处理
  • 4.2 圆柱投影
  • 4.2.1 柱面投影
  • 4.2.2 圆柱中心轴选择
  • 4.2.3 全景图生成
  • 4.3 亮度校正
  • 4.3.1 理论分析
  • 4.3.2 算法实现
  • 4.4 本章小结
  • 第五章 图像编辑
  • 5.1 手工交互图像编辑
  • 5.1.1 算法模型构造
  • 5.1.2 算法实现及优化
  • 5.2 平滑图像半自动修复
  • 5.2.1 Bertalmio的方法简介
  • 5.2.2 平滑区域修复的快速解法
  • 5.3 纹理图像半自动填充
  • 5.3.1 基于纹理块的修复方法
  • 5.3.2 基于纹理块的改进算法
  • 5.3.3 加速算法
  • 5.3.4 实验结果
  • 5.4 本章小结
  • 第六章 视频编辑结果
  • 6.1 运动全景图生成
  • 6.2 视频中运动物体的去除
  • 6.3 视频图像的修复与编辑
  • 6.4 视频去抖动
  • 6.5 本章小结
  • 总结与展望
  • 参考文献
  • 作者在攻读博士学位期间发表的论文
  • 申请专利
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    基于图像拼接的视频编辑
    下载Doc文档

    猜你喜欢