基于龙芯SIMD技术的RealVideo解码优化

基于龙芯SIMD技术的RealVideo解码优化

论文摘要

在龙芯2号处理器的众多应用中,RealVideo视频播放是最重要的应用之一。RealVideo作为目前主流的网络视频格式,在提高性能的同时也带来了更加复杂的编、解码算法。这给龙芯2号处理器播放RealVideo视频文件提出了更高的要求。在龙芯2号平台上,未进行多媒体优化时RealVideo视频解码时间占总播放时间的90%以上,其中去块效应滤波、运动补偿插值运算、重构、反量化等部分的核心应用函数消耗时间又占总解码时间的60%左右。龙芯2号CPU为加强多媒体处理能力,设计实现了一个64位的SIMD定点多媒体指令集。该指令集为在龙芯平台下优化RealVideo解码器提供了可能。本文基于龙芯2号平台的SIMD技术对RealVideo解码器进行了多媒体优化。首先,从静态程序分析的角度入手,对RealVideo的核心压缩算法进行了深入研究,并初步确定优化方向;接着从执行时间和动态指令两个方面分析了解码器在龙芯2号上的动态运行情况,并取得与静态分析相吻合的结果,从而确定了该解码器的核心解码函数;最后通过分析这些核心函数的数据并行性,结合龙芯2号体系结构的特点,使用多媒体指令对RealVideo解码器进行了优化。优化后的RealVideo解码器在龙芯2号平台上的解码效率提高了约30%,播放RealVideo文件的整体效率提高了约20%。这种基于龙芯SIMD技术对RealVideo解码器的优化方法取得了比较理想的效果。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题来源、背景及意义
  • 1.2 研究现状
  • 1.2.1 RealVideo视频解码器在不同平台下的移植与优化
  • 1.2.2 基于龙芯2 号SIMD技术的MPEG-2 视频解码优化
  • 1.3 主要工作及目标
  • 1.4 论文的组织结构
  • 第二章 RealVideo视频解码优化技术
  • 2.1 龙芯2 号处理器及其SIMD技术
  • 2.1.1 龙芯2 号处理器
  • 2.1.2 龙芯2 号多媒体指令集
  • 2.2 龙芯2 号的视频播放软件
  • 2.2.1 播放器的逻辑结构
  • 2.2.2 Mplayer在龙芯平台上的组织结构
  • 2.3 多媒体性能评测基准
  • 2.3.1 Linux系统下的多媒体性能评测
  • 2.3.2 本文的多媒体评测方法
  • 2.4 小结
  • 第三章 RealVideo视频解码器在龙芯2 号上的运行分析
  • 3.1 RealVideo解码流程分析
  • 3.2 RealVideo核心压缩算法分析
  • 3.2.1 1/4 像素精度的运动补偿插值分析
  • 3.2.2 16x16 帧内预测模式分析
  • 3.2.3 整数变换分析
  • 3.2.4 去块滤波分析
  • 3.3 RealVideo解码器在龙芯2 号上的动态运行分析
  • 3.4 优化构想
  • 3.5 小结
  • 第四章 RealVideo解码器在龙芯2 号上的SIMD优化
  • 4.1 滤波部分优化
  • 4.1.1 滤波计算中的数据并行性
  • 4.1.2 优化实现
  • 4.2 运动补偿部分优化
  • 4.2.1 插值计算的数据并行性
  • 4.2.2 优化实现
  • 4.3 其他部分优化
  • 4.3.1 解码器中其它函数的优化
  • 4.3.2 利用系统结构特点进行优化
  • 4.4 小结
  • 第五章 RealVideo解码器优化性能评测
  • 5.1 用于测试的RealVideo视频流
  • 5.2 RealVideo解码核心优化前后的性能比较
  • 5.3 RealVideo解码器在Mplayer应用中的性能比较
  • 5.4 小结
  • 总结与展望
  • 参考文献
  • 攻读硕士学位期间取得的学术成果
  • 致谢
  • 相关论文文献

    • [1].基于“龙芯”SIMD技术的RealVideo去块滤波优化[J]. 计算机工程与设计 2009(03)

    标签:;  ;  ;  

    基于龙芯SIMD技术的RealVideo解码优化
    下载Doc文档

    猜你喜欢