基于共享前端的流多核体系结构关键技术研究

基于共享前端的流多核体系结构关键技术研究

论文摘要

多核处理器主要有两个典型发展方向:以数目较少的复杂核构成的多核处理器(以传统多核处理器为代表,如服务器和桌面CPU)和以数量众多的简单核构成的众核处理器(以多核流处理器为代表,如GPU)。两者各有优缺点:传统多核处理器集成了丰富的控制单元和大量缓存,易于编程,面向广谱应用,但针对计算密集型应用的性能不如多核流处理器;多核流处理器集成了丰富的计算单元,面向计算密集型应用时,吞吐率较大,但控制功能较简单,可编程性相对较差,而且面向访存密集型和稀疏类应用时资源利用率不高,性能不如传统多核处理器。近年来,业界出现了CPU+GPU的异构架构,试图同时发挥两者的优势,然而该架构功耗较大,CPU和GPU的分离存储导致性能瓶颈。基于以上背景,我们提出了同构通用流处理器体系结构:片内集成多个同构的流多核,流多核可根据具体应用配置为CPU或GPU的一部分。该结构试图同时融合上述两种结构的优点:片内共享存储消除了CPU与GPU分离存储带来的数据传输开销、采用64位RISC核增强可编程性、动态配置流多核的功能角色增大芯片资源利用率。流多核是该体系结构中的基本可配置单元。本课题对流多核体系结构关键技术进行了深入研究,主要工作和创新点包括:1、提出了一种基于共享前端的可配置的流多核体系结构。基于同构通用流处理器的总体设计,多个同构流多核需要分别配置成CPU或GPU,以适应应用程序的不同特征需求。本文系统地研究了多核体系结构的特点,包括多核体系结构的由来、传统多核体系结构、多核流体系结构、基于共享前端的传统多核体系结构等。基于以上研究,本文提出了基于共享前端的可配置的流多核体系结构,面向不同应用时可分别按片上SMP执行模式和SIMT执行模式运行。2、对所提出的基于共享前端的流多核体系结构的关键部分进行了逻辑设计。基于流多核的总体设计要求,本文在32位Microblaze软核的基础上进行了多核和64位扩展设计,主要包括64位指令集扩展、单核流水线扩展和性能优化、多核取指地址的产生单元、共享指令ICache和分离数据Dcache、内存管理单元、预取缓冲等。可配置的流多核设计为构建同构通用流处理器奠定了基础。3、基于Xilinx公司ISE开发平台下的ISIM12.1行为仿真软件,对关键部分的逻辑设计进行了功能正确性验证,并进行了一定的性能分析。验证结果显示所有设计均实现了预定的功能,同时性能分析显示了本文设计的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 多核体系结构发展的两个方向
  • 1.1.2 现有多核体系结构面对应用的不足
  • 1.1.3 同构通用流处理器体系结构的提出
  • 1.1.4 CPU 和GPU 融合的现状研究
  • 1.1.5 小结
  • 1.2 论文的主要工作
  • 1.3 论文结构
  • 第二章 多核体系结构
  • 2.1 多核体系结构的由来
  • 2.2 传统多核体系结构
  • 2.3 多核流体系结构
  • 2.4 基于共享前端的传统多核体系结构
  • 2.5 基于共享前端的流多核体系结构的提出
  • 2.6 小结
  • 第三章 同构通用流处理器体系结构
  • 3.1 内部架构
  • 3.2 基于共享前端的流多核体系结构
  • 3.2.1 共享前端流多核整体架构
  • 3.2.2 流多核前端共享架构
  • 3.2.3 流核心的结构
  • 3.3 流多核执行模式
  • 3.3.1 SIMT 执行模式
  • 3.3.2 SMP 执行模式
  • 3.3.3 流多核执行模式的切换
  • 3.4 小结
  • 第四章 流多核关键部分的设计
  • 4.1 指令集与流水线
  • 4.1.1 Microblaze 软核架构简介
  • 4.1.2 扩展后的指令集体系结构
  • 4.1.3 扩展后的流水线体系结构
  • 4.2 取指地址的产生单元
  • 4.2.1 流核心指令地址产生
  • 4.2.2 多核取指令地址选择
  • Cache 和数据DCache'>4.3 指令ICache 和数据DCache
  • 4.3.1 结构和参数选择
  • Cache'>4.3.2 指令ICache
  • Cache'>4.3.3 数据DCache
  • 4.4 内存管理单元
  • 4.4.1 结构与参数选择
  • TLB 的设计'>4.4.2 L1TLB 的设计
  • TLB 的设计'>4.4.3 L2TLB 的设计
  • 4.5 预取缓冲设计
  • 4.6 小结
  • 第五章 模拟验证与性能分析
  • 5.1 验证环境
  • 5.2 流多核关键部件的验证结果
  • 5.3 流多核前端架构的性能分析
  • 5.4 小结
  • 第六章 结束语
  • 6.1 工作总结
  • 6.2 工作展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 相关论文文献

    • [1].金融体系结构优化问题研究[J]. 河北金融 2020(07)
    • [2].面向分布式流体系结构的多副本积极容错技术[J]. 计算机工程与科学 2015(12)
    • [3].网络信息体系结构及其应用研究[J]. 科技创新导报 2015(18)
    • [4].文化对一国金融体系结构的影响作用[J]. 当代财经 2015(08)
    • [5].教育信息化背景下智慧教育的体系结构及关键技术[J]. 时代教育 2018(02)
    • [6].体育大数据产业体系结构的分析与优化[J]. 体育科技 2020(01)
    • [7].物联网的体系结构与发展现状研究[J]. 无线互联科技 2017(12)
    • [8].“银行主导”或“市场主导”金融体系结构:文化视角的解释[J]. 江苏社会科学 2014(03)
    • [9].仿真体系结构发展现状与趋势研究[J]. 计算机工程与应用 2014(09)
    • [10].金融危机前后金融体系结构变化和制度因素分析[J]. 国际金融研究 2013(02)
    • [11].TD-SCDMA体系结构的演进[J]. 黑龙江科技信息 2009(04)
    • [12].基于集中式WLAN体系结构的VoIP应用研究[J]. 中山大学学报(自然科学版) 2009(S1)
    • [13].金融体系结构与金融危机[J]. 金融评论 2009(01)
    • [14].新一代互联网体系结构理论研究进展[J]. 中国科学(E辑:信息科学) 2008(10)
    • [15].一种双向支持的并行工程体系结构[J]. 机械工程与自动化 2017(05)
    • [16].最优金融体系结构的路径选择[J]. 金融博览 2015(04)
    • [17].国外装甲车辆电子体系结构的最新发展[J]. 四川兵工学报 2015(05)
    • [18].试验训练领域仿真体系结构及研究现状[J]. 国防科技 2015(03)
    • [19].金融体系结构与经济自由的关系——基于139个国家1980~2013年数据的研究[J]. 金融论坛 2015(10)
    • [20].未来互联网体系结构的研究探索[J]. 网络安全技术与应用 2013(07)
    • [21].未来互联网体系结构的研究探索[J]. 无线互联科技 2013(06)
    • [22].究竟是什么决定了一国的金融体系结构[J]. 财经研究 2012(01)
    • [23].基于体系结构技术的部队网顶层设计[J]. 装甲兵工程学院学报 2011(02)
    • [24].外军体系结构的发展应用及启示[J]. 通信技术 2010(02)
    • [25].面向服务的企业的体系结构与关键技术[J]. 航空制造技术 2010(03)
    • [26].面向服务的体系结构产品描述方法研究[J]. 中国电子科学研究院学报 2009(05)
    • [27].浅谈软件的体系结构与模式[J]. 科技风 2009(19)
    • [28].以活动为中心的体系结构设计方法研究[J]. 系统工程与电子技术 2008(03)
    • [29].浅论自动控制理论基础课程的新体系结构[J]. 河北农机 2014(04)
    • [30].金融体系结构、金融效率与金融稳定[J]. 金融监管研究 2013(05)

    标签:;  ;  ;  ;  

    基于共享前端的流多核体系结构关键技术研究
    下载Doc文档

    猜你喜欢