高性能嵌入式RISC微处理器核设计研究

高性能嵌入式RISC微处理器核设计研究

论文摘要

芯片设计技术和深亚微米工艺的进步使得系统集成在一块芯片中实现成为可能,嵌入式系统设计进入片上系统芯片时代。本文作者参与了浙江大学信息与电子工程学系SoC R&D小组承担的国家863超大规模集成电路设计重大项目和具有自主知识产权的媒体系统芯片MediaSoC3221A设计和研发工作。本文主要探讨MediaSoC3221A双核之一的嵌入式RISC处理器的设计研究,本文的主要内容和创新如下: RISC处理器面向的应用范围广泛,不同的应用的特点不一样,对处理器的构造要求也不一样。比如有些应用存在丰富的线程并行性,采用多线程或者多核构造的处理器比较合适;有些应用本身就是一个不可拆分的单线程应用,采用高性能的多发射处理器更为适合。基于此本文提出通过两个简单RISC3200处理器设计在微结构上双发射与双核融合的RISC3202处理器。这也就是说,RISC3202在指令构造上与RISC3200一致,但在微结构上可以根据应用的特点配置成双发射超标量处理器,或者两个独立的RISC3200处理器,这是一种RISC处理器微结构构造创新。 媒体应用是当今处理器设计的驱动源之一,它已经成为RISC处理器必须考虑的工作负载。但是传统的基于RISC构造的处理器在提出之初并不是针对这类应用设计和优化的,因而它在处理这类应用时效率不高,必须对其指令集进行面向媒体处理的扩展,以提升其媒体处理的性能。本文针对RISC3200处理器第一代媒体扩展指令集MDS-Ⅰ存在数据处理效率高、数据供应效率低的缺点,新提出用于数据供应的媒体扩展指令集MDS-Ⅱ,有效提升了RISC3200的媒体处理效率。 在进行微处理器的功能仿真验证时,一个关键问题就是如何高效高质量的开发各种各样的验证程序。高效是指能快速开发出各种不同验证目的的验证程序,高质量是指开发出的验证程序的针对性好,能快速覆盖处理器需要验证的功能。针对这个问题,本文提出基于RISC3200指令构造的伪随机自动程序生成方法。它的核心包括两个部分:指令生成模型和程序模板。指令生成模型保证生成的指令合法有效,程序模板保证生成的指令序列针对性好。采用该方法后将验证程序的开发转换为C下的模板程序的开发,极大的方便了RISC3200仿真验证过程中的验证程序生成。 在系统芯片设计中,如何快速优化嵌入式软件也是一个非常关键的问题。本文以实现基于RISC3200的MP3软件解码器为例,对这个问题展开研究。在此基础上,总结出嵌入式软件优化的普遍原则和方法,并实际应用到MP3的解码软件优化中,取得不错的优化效果。然后根据新设计的RISC3202处理器的微结构特点,提出将MP3解码软件拆分成两个线程并行执行,在RISC3202上取得1.78的性能加速比。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 嵌入式微处理器的分类及特点
  • 1.1.1 RISC处理器
  • 1.1.2 DSP处理器
  • 1.1.3 混合类型处理器
  • 1.2 微处理器的研发现状和发展趋势
  • 1.2.1 指令级并行
  • 1.2.2 线程或进程级并行性
  • 1.2.3 片上处理器与内存融合
  • 1.3 媒体系统芯片的架构、设计与验证方法
  • 1.3.1 媒体系统芯片架构
  • 1.3.2 媒体系统芯片的设计方法
  • 1.3.3 媒体系统芯片的功能验证方法
  • 1.4 本文的主要研究内容、创新点和内容安排
  • 第二章 RISC处理器微结构研究
  • 2.1 单发射RISC3200微结构
  • 2.1.1 流水线组成
  • 2.1.2 流水线事件
  • 2.1.3 流水线控制
  • 2.2 双发射与双核刃SC3202架构设计
  • 2.2.1 双核架构设计
  • 2.2.2 双发射架构设计
  • 2.2.3 微结构组成框架
  • 2.3 双发射RISC3202微结构关键部件设计
  • 2.3.1 数据旁路部件设计
  • 2.3.2 流水线事件及其控制
  • 2.4 双发射的 RISC3202微结构的 PCU设计
  • 2.4.1 流水线控制策略
  • 2.4.2 流水线控制部件有限状态机设计
  • 2.4.3 流水线控制部件的时延优化
  • 2.5 RISC3202初步性能评估
  • 2.6 本章小结
  • 第三章 RISC构造的指令扩展设计和功能仿真验证
  • 3.1 微处理器指令扩展设计原则
  • 3.1.1 软硬件协同设计原则
  • 3.1.2 指令体系兼容原则
  • 3.1.3 简单高效原则
  • 3.2 RISC3200指令扩展设计
  • 3.2.1 媒体处理的性能颈瓶
  • 3.2.2 MDS-Ⅱ数据供应指令扩展设计
  • 3.2.3 MDS-Ⅱ指令编码设计
  • 3.2.4 媒体指令扩展的性能评估
  • 3.2.5 DSP处理的指令扩展
  • 3.3 RISC3200功能仿真验证
  • 3.3.1 设计与验证流程
  • 3.3.2 功能仿真验证流程
  • 3.3.3 功能仿真验证内容
  • 3.4 功能仿真验证的激励生成
  • 3.4.1 伪随机自动生成验证程序架构
  • 3.4.2 指令生成模型设计
  • 3.4.3 程序模板的设计
  • 3.4.4 实验结果
  • 3.5 本章小结
  • 第四章 媒体 SoC中的软件优化方法研究
  • 4.1 嵌入式软件的优化原则与步骤
  • 4.2 基于RISC3200的MP3解码软件优化
  • 4.2.1 MP3标准分析
  • 4.2.2 软件优化目标
  • 4.2.3 C下的算法优化
  • 4.2.4 汇编结构优化
  • 4.2.5 实验结果
  • 4.3 基于新的硬件的MP3解码软件的优化
  • 4.3.1 基于 RISC3202的MP3解码软件优化
  • 4.3.2 基于 MDS的MP3解码软件优化
  • 4.3.3 基于 MP3解码软件的硬件设计探讨
  • 4.4 本章小结
  • 全文总结
  • 参考文献
  • 作者攻读博士学位期间发表的主要学术论文
  • 作者攻读博士学位期间参与的科研工作
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    高性能嵌入式RISC微处理器核设计研究
    下载Doc文档

    猜你喜欢