基于GPU的H.264到AVS视频转码并行设计

基于GPU的H.264到AVS视频转码并行设计

论文摘要

H.264标准是当今压缩性能最优的标准,但是高昂的专利费用一直阻碍其在中国使用,于是我国自主研发了拥有与H.264性能相媲美性能的AVS (Audio Video coding Standard,数字音视频)标准。两种标准将在很长一段时间内长期共存,但由于两种标准计算复杂度比较高,使得二者之间的转码成为一个重要的研究课题。近年来GPU (Graphic Processing Unit,图形处理单元)的通用计算能力得到快速发展,特别是2007年英伟达(NVIDIA)公司推出了支持C语言与OpenCL语言的CUDA(Compute Unified Device Architecture,计算统一设备架构)软件平台,从而使GPU的程序开发变得简单灵活,也使得GPU在视频转码领域中有更为广阔的应用前景。本文的并行转码器采用CPU+GPU的双线程设计,CPU和GPU并发协同工作。CPU作为主线程负责转码中的熵解码、数据交互以及资源调度工作,GPU作为从线程负责转码中除熵解码外其它模块的工作,这样设计可以降低CPU与GPU间数据传递的次数。在转码过程中,为了充分发挥GPU并行计算的优势,为转码中计算密集、耗时长的模块设计并行算法。针对帧内预测环节邻块的相关性,设计了梯状并行算法。针对帧间运动估计环节,设计了一种基于全搜索的运动估计并行算法,该算法取消了利用邻块的运动矢量预测搜索起始点的环节,而是将搜索起始点设置为0提高并行粒度。针对熵编码中数据依赖、控制相关、码流存储优先等难题,提出了一种并行熵编码算法,该算法割裂了宏块间熵编码、码流优先存储的相关性,解决了限制熵编码并行实现的难题。针对两种视频标准关键环节的相似性,在转码过程中重用解码得到的信息,分别提出了基于信息重用的帧内预测、运动估计的并行算法,通过降低计算复杂度提高转码的速度。最后通过实验测试转码中各个模块的加速比以及图像性能指标,并对并行转码器的整体性能进行测评。实验结果表明:本文设计的并行转码器充分发挥了CPU与GPU硬件的特点,对计算密集的模块设计了适合GPU运行的并行算法,在保证图像质量的情况下,大大提高了转码速度。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 课题研究背景
  • 1.2 视频转码国内外研究现状概述
  • 1.2.1 视频转码的研究现状与热点
  • 1.2.2 GPU在视频转码领域的应用
  • 1.3 本文研究内容与章节安排
  • 2 H.264与AVS标准以及GPU编程基础知识概述
  • 2.1 视频压缩标准发展史
  • 2.2 H.264与AVS视频编码标准
  • 2.2.1 H.264解码与AVS编码原理
  • 2.2.2 H.264与AVS标准关键技术及其异同点
  • 2.3 GPU编程与CUDA架构概述
  • 2.3.1 GPU的发展简介
  • 2.3.2 GPU的硬件结构以及与CPU的比较
  • 2.3.3 CUDA的编程知识概述
  • 2.4 GPU应用于视频压缩领域的优势与挑战
  • 2.5 本章小结
  • 3 基于GPU的H.264到AVS视频转码并行算法设计
  • 3.1 H.264到AVS转码器结构框架设计
  • 3.1.1 传统的H.264到AVS转码器的框架结构
  • 3.1.2 CPU+GPU异构H.264到AVS并行视频转码架构设计
  • 3.2 帧内预测并行算法
  • 3.2.1 亮度、色度帧内预测并行算法
  • 3.2.2 转码帧内预测模式重用并行算法
  • 3.2.3 两种帧内预测算法性能比较
  • 3.3 运动估计并行算法
  • 3.3.1 像素内插与运动估计并行算法
  • 3.3.2 并行运动矢量搜索合并算法
  • 3.3.3 转码矢量重用并行算法
  • 3.3.4 CUDA分析软件Profile分析算法性能
  • 3.4 AVS熵编码并行算法设计
  • 3.4.1 AVS熵编码框架
  • 3.4.2 并行熵编码相关性分析
  • 3.4.3 指数哥伦布编码并行算法
  • 3.4.4 两级码流合并并行算法
  • 3.5 转码过程中CPU与GPU并行处理设计与分析
  • 3.6 本章小结
  • 4 实验结果举例与分析
  • 4.1 帧内预测并行算法的实验
  • 4.2 帧间运动估计算法的实验
  • 4.3 熵编码并行算法实验
  • 4.4 整体性能分析
  • 4.5 本章小结
  • 5 总结与展望
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    • [1].双齿围沙蚕(Perinereis aibuhitensis)的生物扰动作用对沉积物中AVS分布的影响[J]. 中国渔业质量与标准 2020(03)
    • [2].奥迪AVS可变气门升程系统浅析[J]. 无锡南洋职业技术学院论丛 2019(Z1)
    • [3].AVS+专业卫星综合接收解码器测试分析[J]. 广播电视信息 2015(09)
    • [4].AVS专利联盟与华为自主创新关系研究[J]. 科技进步与对策 2014(22)
    • [5].AVS解码帧内预测器的硬件设计[J]. 微电子学与计算机 2012(01)
    • [6].基于FPGA的AVS视频解码帧内预测的设计和实现[J]. 电视技术 2012(20)
    • [7].AVS解码中反量化的FPGA实现[J]. 微电子学与计算机 2010(07)
    • [8].基于AVS的帧内预测算法[J]. 微计算机信息 2010(36)
    • [9].AVS标准中非必要专利的侵权风险分析[J]. 中国发明与专利 2008(09)
    • [10].浅析AVS编解码标准[J]. 电脑学习 2008(05)
    • [11].AVS空间可伸缩编码中降采样滤波器的设计[J]. 科学技术与工程 2014(35)
    • [12].AVS编码器帧内预测模块[J]. 计算机系统应用 2015(01)
    • [13].快速AVS帧内预测算法[J]. 计算机应用与软件 2015(06)
    • [14].AVS编码器中帧内预测模块的硬件设计[J]. 电视技术 2013(17)
    • [15].AVS熵编码的FPGA实现[J]. 软件 2012(02)
    • [16].基于FPGA的AVS编码器帧内预测实现[J]. 软件 2012(02)
    • [17].基于AVS的快速亚像素运动估计算法[J]. 计算机工程与设计 2012(07)
    • [18].AVS解码器帧内预测模块硬件优化设计[J]. 小型微型计算机系统 2010(01)
    • [19].AVS高清视频环路滤波结构与电路实现[J]. 微电子学与计算机 2010(03)
    • [20].AVS软件解码器瓶颈分析与优化[J]. 电子测量技术 2010(04)
    • [21].AVS视频标准的帧内预测算法改进[J]. 宁波大学学报(理工版) 2009(02)
    • [22].AVS解码器帧内预测并行自适应硬件实现[J]. 电视技术 2009(S2)
    • [23].AVS解码器中帧内预测算法的硬件实现[J]. 电视技术 2008(12)
    • [24].AVS数字视频解码中反量化/反变换的FPGA实现[J]. 现代商贸工业 2008(03)
    • [25].AVS反扫描、反量化和反变换模块的一种优化设计[J]. 计算机工程与应用 2008(19)
    • [26].AVS视频图像缩放模块的设计与实现[J]. 计算机与现代化 2008(11)
    • [27].一种新型的AVS熵解码码表结构[J]. 电视技术 2014(05)
    • [28].AVS解码器环路滤波的优化及实现[J]. 电视技术 2013(05)
    • [29].基于FPGA的AVS帧内预测电路设计[J]. 电子技术应用 2013(08)
    • [30].基于FPGA的AVS帧内预测的研究与设计[J]. 微计算机信息 2012(09)

    标签:;  ;  ;  ;  ;  

    基于GPU的H.264到AVS视频转码并行设计
    下载Doc文档

    猜你喜欢