视频压缩编码的运动估计与补偿技术

视频压缩编码的运动估计与补偿技术

论文摘要

本文主要讨论视频压缩编码的运动估计与补偿技术,方块匹配方法(BMA)在非平移运动情况下的预测误差较大,同时占用编码器一半以上的运算量。本文首先讨论运动估计的快速计算方法,然后提出可变形块匹配算法(DBMA),提高运动估计的准确性。本文介绍了人眼视觉系统生理特性和视频压缩编码的理论基础,指出视频压缩的基本方法和运动估计与补偿的关键作用;介绍了视频压缩编码的系统结构,总结并比较现有的各种视频压缩编码标准,说明运动估计在实际编码系统中的使用方法及发展过程;分析真实场景的运动变化在二维图像上的参数表示方法,并概括介绍各种运动估计方法。为了降低现行系统中使用的BMA的复杂度,本文首先介绍几种有代表性的快速算法,全面总结了视频信号属性和运动场的分布特征,详细分析利用信号特征加快BMA的方法,在理论分析基础上提出自适应快速搜索算法(APFS),在相近预测质量的条件下比现行性能较好的H.264推荐算法平均减少约60%的搜索点数;提出误差曲面参数模型与搜索相结合的分数像素精度快速算法,减少约50%的分数像素精度估计运算量,实现了完整的快速BMA解决方案。本文也给出了实时转码系统的运动重估计方案,满足实际应用需要且复杂度极低。为了减小运动估计的预测误差,本文从根本上解释了BMA不能表示非平移运动的缺陷,引入基于节点位移的可变形块运动模型,给出预测精度高、运算量低且易于实现的节点位移搜索算法(NS-DBMA),有效减小预测误差。在NS-DBMA基础上,提出了快速计算方法、整数实现方法、双模式混合估计方法、分数像素精度预测方法、六边形搜索方法等改进算法,进一步降低DBMA的实现难度并提高预测精度,整个过程都以整数加法和移位运算实现,适合应用于实际编码系统。测试结果表明,综合各项改进的方法的DBMA的运算量相当于全搜索BMA的16.5%,可将预测图像质量提高3.79dB,在实际编码系统中也可以得到1.2dB的性能提升,具有广泛的应用前景。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 视频压缩编码概述
  • 1.2 视频压缩基础
  • 1.2.1 人眼视频系统的生理特性
  • 1.2.2 视频信号表示
  • 1.2.3 经典信息论
  • 1.3 运动估计与补偿的发展和现状
  • 1.4 论文的研究内容和组织结构
  • 第二章 视频压缩编码系统与标准
  • 2.1 视频压缩编码的系统结构
  • 2.1.1 输入单元
  • 2.1.2 运动估计和运动补偿单元
  • 2.1.3 编码模式控制单元
  • 2.1.4 正交变换和量化单元
  • 2.1.5 游程编码单元
  • 2.1.6 熵编码单元
  • 2.1.7 环路滤波单元
  • 2.1.8 输出缓存与码率控制单元
  • 2.1.9 编码流程
  • 2.2 视频压缩编码标准
  • 2.2.1 H.120 标准
  • 2.2.2 H.261 标准
  • 2.2.3 H.263 标准
  • 2.2.4 MPEG-1 标准
  • 2.2.5 MPEG-2 标准
  • 2.2.6 MPEG-4 标准
  • 2.2.7 H.264 标准
  • 2.2.8 AVS 标准
  • 2.2.9 VC-1 和其它编码标准
  • 2.3 视频压缩系统的性能评价
  • 2.4 视频压缩系统的比较
  • 2.4.1 H.26x 性能比较
  • 2.4.2 MPEG-x 性能比较
  • 2.4.3 MPEG-4、H.264 和 AVS 性能比较
  • 2.5 小结
  • 第三章 视频运动模型与估计方法
  • 3.1 摄像机投影模型及其运动方式
  • 3.2 物体运动模型
  • 3.3 场景模型
  • 3.4 二维运动模型
  • 3.4.1 平移运动模型
  • 3.4.2 仿射运动模型
  • 3.4.3 双线性运动模型
  • 3.4.4 伪透视运动模型
  • 3.5 运动估计方法
  • 3.5.1 全局运动估计
  • 3.5.2 像素运动估计
  • 3.5.3 区域运动估计
  • 3.5.4 方块运动估计
  • 3.5.5 网格运动估计
  • 3.5.6 可变形块运动估计
  • 3.5.7 多分辨率运动估计
  • 3.5.8 各种运动估计方法的比较与应用
  • 3.6 小结
  • 第四章 方块匹配的运动估计算法
  • 4.1 方块匹配算法
  • 4.1.1 匹配准则
  • 4.1.2 搜索范围
  • 4.1.3 估计精度
  • 4.1.4 搜索算法
  • 4.2 快速方块匹配算法介绍
  • 4.2.1 连续排除法(SEA)
  • 4.2.2 三步搜索法(TSS)
  • 4.2.3 菱形搜索算法(DSA)
  • 4.2.4 非对称十字多层六边形搜索(UMHexagonS)
  • 4.2.5 快速 BMA 的性能比较
  • 4.3 快速BMA 的总结和分析
  • 4.3.1 误差曲面的单峰分布特性
  • 4.3.2 MV 中心分布特性
  • 4.3.3 MV 的时空相关特性
  • 4.3.4 预测子性能分析
  • 4.3.5 搜索点阵性能分析
  • 4.3.6 阈值分析
  • 4.4 一种改进的快速 BMA
  • 4.4.1 算法描述
  • 4.4.2 测试与分析
  • 4.5 分数像素精度运动估计算法
  • 4.5.1 完整邻域模型
  • 4.5.2 5 点邻域模型
  • 4.5.3 测试结果
  • 4.6 转换编码器的运动估计技术
  • 4.6.1 码率转换中的运动估计
  • 4.6.2 标准转换中的运动估计
  • 4.6.3 分辨率转换中的运动估计
  • 4.6.4 转码系统介绍与测试结果
  • 4.7 小结
  • 第五章 可变形块匹配的运动估计算法
  • 5.1 平移模型的不足和改进方法
  • 5.1.1 BMA 的局限和不足
  • 5.1.2 重叠块运动补偿算法(OBMC)
  • 5.1.3 环路滤波
  • 5.1.4 可变大小块法
  • 5.1.5 可变形块法
  • 5.2 基于节点位移的可变形块运动模型
  • 5.3 基于梯度的可变形块匹配算法(GB-DBMA)
  • 5.4 基于节点搜索的可变形块匹配算法(NS-DBMA)
  • 5.5 可变形块运动估计的实现方法
  • 5.5.1 NS-DBMA 的快速计算方法
  • 5.5.2 NS-DBMA 的整数实现方法
  • 5.6 双模式混合估计方法
  • 5.7 可变形块匹配的几项扩展
  • 5.7.1 分数像素精度预测
  • 5.7.2 六边形搜索的可变形块匹配算法(HS-DBMA)
  • 5.8 测试与分析
  • 5.8.1 BMA 与DBMA 性能比较
  • 5.8.2 NS-DBMA 的性能改进测试
  • 5.9 DBMA 在实际编码系统中的应用
  • 5.10 小结
  • 第六章 总结和展望
  • 参考文献
  • 发表论文和参加科研情况
  • 附录
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    视频压缩编码的运动估计与补偿技术
    下载Doc文档

    猜你喜欢