论文摘要
与之前的视频编码标准相比,H.264标准在提升编码性能的同时也使得实现的复杂度大大增加。H.264的帧间预测模块采用了更多样的编码尺寸、更加精细的运动矢量和更多的参考帧,运算量大,过程十分复杂。GPU的强大处理能力早期只能用于3D图像渲染,应用范围受到限制。CUDA (Compute Unified Device Architecture,计算统一设备架构)的出现使得GPU可以用于通用计算,为H.264编码算法的研究与改进提供了新的契机。本文研究了视频编码的基本原理,介绍了H.264编码器的结构,并对其中的帧间预测部分的原理进行了探讨,分析和总结了国内外学者在运动估计、模式判决等方面的研究。之后,本文结合GPU和CUDA的特点,对H.264的帧间预测部分进行了算法改进:在运动估计部分,对全搜索算法进行改进,先计算小尺寸分割的SAD值,之后渐进式的组合出大的分割尺寸的SAD值;将分散于各个宏块预测过程的拉格朗日因子的计算过程全部提至同一帧中所有宏块的预测过程之前;提出新的便于在GPU上实现的模式判决代价函数;而后,将同一帧中所有宏块的帧间预测过程整合到一起。接着,本文对运算过程中的数据做了抽象处理后排列为大规模的矩阵,使得原本运行于CPU上的包含复杂逻辑运算的帧间预测过程转化为运行于GPU上的大规模矩阵的简单大量运算。本文对提出的方法在NVIDIA GPU上进行了实现和验证,发现使用GPU进行视频编码中的帧间预测部分是可行的。编码形成的码流能够正确解码,视频图像清晰。编码速度得到提升,码率也保持在一定的范围内。
论文目录
摘要ABSTRACT第一章 引言1.1 课题研究背景及意义1.2 国内外研究现状1.3 主要工作1.4 本文组织结构第二章 H.264 视频编码概述2.1 H.264 编码基本原理2.1.1 H.264 编码数据格式2.1.2 H.264 编码器结构2.2 预测编码及模式判决2.2.1 帧间预测2.2.2 帧内预测2.2.3 模式判决2.3 其他重要功能块2.4 本章小结第三章 基于CUDA 的GPU 运算3.1 CUDA 编程模型3.2 CUDA 软件体系3.3 CUDA 硬件模型3.4 CUDA 存储器层次结构3.5 GPU 并行性能优化3.6 CUDA 的缺点3.7 本章小结第四章 基于CUDA 的H.264 帧间预测并行化算法4.1 帧间预测的并行化潜力4.1.1 大量的计算4.1.2 相对独立性4.2 基于CUDA 的帧间预测并行化算法4.2.1 整合计算量4.2.2 消除依赖性方法4.3 亚像素运动估计置后SKIP 模式判决策略'>4.4 优化PSKIP 模式判决策略4.5 本章小结第五章 基于CUDA 的H.264 帧间预测的并行化实现5.1 X264 概述5.2 帧间预测的并行化5.2.1 整体框架5.2.2 帧间预测SKIP 模式判决与亚像素运动估计'>5.3 PSKIP 模式判决与亚像素运动估计5.4 测试与分析5.4.1 测试平台5.4.2 不同运动程度的视频序列5.4.3 不同分辨率的视频序列5.5 应用前景简析5.6 本章小结第六章 结论6.1 本文总结6.2 存在的问题与不足6.3 工作展望致谢参考文献
相关论文文献
标签:帧间预测论文; 模式判决论文;
基于CUDA的H.264编码帧间预测算法的研究与实现
下载Doc文档