视频编解码专用处理器及其VLSI实现研究

视频编解码专用处理器及其VLSI实现研究

论文摘要

随着视频应用对处理器性能要求的不断提高,面向视频编解码的专用指令集处理器(Application Specific Instruction-set Processor,ASIP)设计已成为了目前的研究热点之一。本文围绕面向视频编解码应用的ASIP设计及其VLSI实现从以下三方面展开了研究工作:1.比特流处理器设计针对视频解码应用中的比特流解析、变长熵解码等串行操作,提出了一种高效的比特流处理器结构。通过分析比特流处理的计算核心及速度瓶颈,针对频繁出现的共性操作,如showbits、getbits、flushbits等,提出了7条变长解码专用指令及其硬件实现结构。实验结果表明,结合LNZ分组解码算法,该比特流处理器在150MHz工作频率下可以满足高清1080i格式的H.264/AVC实时解码性能要求。并且其硬件实现开销和设计复杂度等都很小。该结构已经成功应用于自主研发设计的Spock处理器中的变长编解码(Variable Leng Coding/Decoding,VLX)特殊功能执行单元。这使得Spock在视频编解码应用中的性能得到了大大提高,能够胜任流处理器的角色。2.并行存储结构设计针对SIMD(Single Instruction Multiple Data)处理器在视频编解码中内存读写操作带来的大量额外非计算开销,提出了一种高效的2维并行存储结构。结合视频编解码主要算法,分析所需的数据存取格式,提出了两种数据交织存储方案A-scheme和S-scheme。它们分别为视频应用中的两种数据类型(8bit像素和16bit变换系数)提供2维空间行列方向上数据的连续并行访问和间隔步长为21的并行访问。实验结果表明,在H.264实时解码中,该并行存储器结构比字节寻址存储结构性能平均提高了1.28倍。同时,提出的硬件实现结构简单,并易于在不同数据总线宽度的处理器平台上扩展。随着数据带宽的增加,其优势更为明显。3.Shubert处理器设计针对传统SIMD指令集体系中严格要求的操作数格式所带来大量的数据重新组织开销,提出了一种显示数据组织SIMD(Explicit Data Organization,EDO-SIMD)指令集体系结构。它显性地将数据置换信息声明在指令中,将数据组织与数据运算操作合并在一起执行,由在寄存器文件和SIMD计算单元之间增加的数据置换网络提供灵活的操作数格式,从而有效提高SIMD处理器的并行性能。我们自主研发了支持EDO-SIMD指令体系的Schubert视频处理器。它是基于非耦合的存取/执行体系结构设计的,并结合主要视频编解码算法扩展了EDO-SIMD视频专用指令集。仿真结果显示,扩展指令有效提高了Schubert处理器在多种视频标准应用中的性能。Schubert分别在11.4MHz和49.1MHz的工作频率下可完成QCIF、CIF分辨率并且速率为30帧/秒的H.264实时解码应用。

论文目录

  • 致谢
  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景及意义
  • 1.2 本文研究内容及主要创新点
  • 1.3 论文结构
  • 第2章 视频编码技术和编码标准
  • 2.1 引言
  • 2.2 视频编码技术
  • 2.2.1 帧内预测编码
  • 2.2.2 帧间预测编码
  • 2.2.3 变换编码
  • 2.2.4 量化编码
  • 2.2.5 统计编码
  • 2.3 视频编码标准
  • 2.3.1 H.261
  • 2.3.2 MPEG-1
  • 2.3.3 MPEG-2
  • 2.3.4 H.263
  • 2.3.5 MPEG-4
  • 2.3.6 H.264/AVC编码标准
  • 2.3.7 AVS编码标准
  • 2.3.8 VC-1编码标准
  • 2.4 本章小结
  • 第3章 视频处理器
  • 3.1 视频压缩算法分析
  • 3.1.1 复杂度分析
  • 3.1.2 并行性分析
  • 3.2 视频处理器分类
  • 3.2.1 专用功能单元集成结构
  • 3.2.2 通用处理器多媒体指令扩展
  • 3.2.3 可重配置处理器
  • 3.2.4 可编程专用处理器
  • 3.3 本章小结
  • 第4章 比特流处理器设计
  • 4.1 引言
  • 4.1.1 H.264/AVC中CAVLC编码原理
  • 4.1.2 专用结构的必要性
  • 4.2 比特流处理器相关研究
  • 4.3 比特流处理器设计
  • 4.3.1 变长解码专用指令
  • 4.3.2 硬件结构
  • 4.3.3 实验结果及性能比较
  • 4.4 应用实例Spock处理器
  • 4.5 本章小节
  • 第5章 并行存储器结构设计
  • 5.1 引言
  • 5.2 并行存储器相关研究
  • 5.3 视频应用中的数据存储格式
  • 5.4 并行存储方案设计
  • 5.4.1 连续访问的A-scheme方案
  • 5.4.2 间隔访问的S-scheme方案
  • 5.5 硬件实现结构
  • 5.6 仿真结果及比较
  • 5.7 性能比较
  • 5.8 本章小节
  • 第6章 Schubert视频处理器设计
  • 6.1 引言
  • 6.2 EDO-SIMD指令体系结构
  • 6.3 Schubert视频处理器体系架构
  • 6.4 Schubert视频专用指令集扩展
  • 6.4.1 余弦变换类
  • 6.4.2 运动估计
  • 6.4.3 预测和插值(FIR类)
  • 6.4.4 环内去块效应滤波
  • 6.5 指令集性能评估
  • 6.5.1 余弦变换
  • 6.5.2 环内去块效应滤波
  • 6.5.3 H.264解码应用
  • 6.6 微体系结构设计与实现
  • 6.6.1 数据通路
  • 6.6.2 存取单元
  • 6.7 VLSI实现结果
  • 6.8 本章小节
  • 第7章 总结与展望
  • 7.1 论文总结
  • 7.2 未来工作展望
  • 参考文献
  • 作者简历及在学位期间所取得的科研成果
  • 相关论文文献

    • [1].垃圾处理器进入大渠道的困境[J]. 现代家电 2019(22)
    • [2].基于FPGA的32位多并行2DFFT处理器的设计[J]. 广西科技大学学报 2020(01)
    • [3].废弃食物处理器选购有讲究[J]. 质量与标准化 2020(Z1)
    • [4].报告:到2026年,嵌入式处理器市场将达到363.8亿美元[J]. 功能材料信息 2019(06)
    • [5].垃圾处理器营销渠道走向前台[J]. 现代家电 2019(17)
    • [6].创新推动垃圾处理器本土化进程[J]. 现代家电 2020(07)
    • [7].用标准推动行业健康发展 保障消费者良好体验[J]. 现代家电 2020(07)
    • [8].风头正劲的垃圾处理器市场[J]. 现代家电 2020(07)
    • [9].后疫情时代 垃圾处理器步入稳健发展[J]. 现代家电 2020(07)
    • [10].垃圾处理器的B端市场突破[J]. 现代家电 2020(07)
    • [11].利用平台优势 推动垃圾处理器快速增长[J]. 现代家电 2020(07)
    • [12].2020二季度手机处理器市场[J]. 中国科技信息 2020(20)
    • [13].安全处理器研究进展[J]. 信息安全学报 2018(01)
    • [14].骁龙821处理器等于骁龙820超频版[J]. 个人电脑 2017(01)
    • [15].走近国产处理器[J]. 个人电脑 2016(09)
    • [16].众核处理器核间通信的研究[J]. 价值工程 2015(17)
    • [17].面向高性能计算的众核处理器轻量级错误恢复技术研究[J]. 计算机研究与发展 2015(06)
    • [18].“愚公号”垃圾处理器[J]. 小星星(低年级版) 2020(Z2)
    • [19].《污气处理器》[J]. 课堂内外(小学低年级) 2019(05)
    • [20].龙芯总设计师:明年将推出全自主可控处理器“3B3000”[J]. 电脑迷 2015(08)
    • [21].高效低能耗 未来处理器发展方向[J]. 电脑迷 2008(10)
    • [22].电脑靠什么来节能(3) 处理器篇[J]. 电脑迷 2008(09)
    • [23].陌生的处理器 新本怎么选?[J]. 电脑爱好者 2009(03)
    • [24].无处不在 嵌入式处理器解析[J]. 电脑迷 2010(12)
    • [25].22nm来袭 Intel Ivy Bridge处理器前瞻[J]. 电脑迷 2011(16)
    • [26].揭秘骗术 盒装处理器选购谈[J]. 电脑爱好者 2013(16)
    • [27].有必要追求最新64位处理器吗[J]. 电脑爱好者 2014(21)
    • [28].尾数有变! 读懂手机处理器的后缀密码[J]. 电脑爱好者 2017(07)
    • [29].不再是处理器 浅析高通骁龙835移动平台[J]. 电脑爱好者 2017(09)
    • [30].重新定义中端 AMD Ryzen 5 1600处理器[J]. 电脑爱好者 2017(14)

    标签:;  ;  ;  ;  ;  

    视频编解码专用处理器及其VLSI实现研究
    下载Doc文档

    猜你喜欢