论文摘要
近年来,基于FPGA的可重构处理器在加速图像处理应用方面显得越来越重要,主要原因在于其同时综合了ASIC和通用处理器的优点。然而,当前的体系结构并没有完全结合程序的特征,处理单元和结构较为复杂。针对图像处理算法的特点,本文试图研究一种有着简单的处理单元和结构并能通过重构机制达到结构与运算的最优结合的粗粒度可重构体系结构。基于图像处理算法的特点,文中介绍了一种粗粒度LEAP(Loop Engine on ArrayProcessor)体系结构,这种结构基于循环流水化的执行方式,其本质上是一个加速核心循环执行的数据驱动的体系结构,拥有可重构处理单元阵列(cPE)和可重构局部数据存储器(mPE)。这个结构的目标是把高级语言程序直接映射到处理单元阵列上,通过操作在阵列结构上的分布,处理单元阵列能够有效且自动地完成循环的计算任务,它提供了循环自动流水化的执行机制,最大地开发程序的并行性。为了说明LEAP体系结构在图像处理算法硬化上的有效性和优越性,本文选取了三个图像处理算法进行验证,分别是中值滤波算法、Sobel边缘检测算法和矩阵乘算法。将三个图像处理算法在LEAP结构上分别做了映射并进行了性能分析和比较。根据LEAP结构的特点,对中值滤波算法进行了改进,并对矩阵乘算法的硬件结构进行了优化。整个设计使用Verilog HDL硬件开发语言,在ISE 8.2和ModelSim等仿真软件环境下开发的,通过EDK进行硬件平台的搭建,在Xilinx FPGA Virtex-ⅡPro硬件平台上进行了实现,所有测试都能正确执行,性能明显高于DSP芯片和普通微处理器。