同时多线程处理器资源共享控制策略研究

同时多线程处理器资源共享控制策略研究

论文摘要

随着超大规模集成电路技术持续以指数级地发展,处理器芯片上集成的资源将大量地增加,如何有效利用这些资源成为发挥处理器性能的关键。同时多线程(SMT)处理器通过同时执行来自多个线程的指令利用了线程级并行和指令级并行,其细粒度的资源共享和操作延迟隐藏为处理器带来较好的性能提升。然而同时多线程环境中,线程竞争共享资源胜过分享资源,不合理的资源竞争将会导致共享资源的阻塞、滥用和浪费。资源共享控制的合理性决定了处理器的吞吐量和线程间的公平性。随着处理器和存储器之间性能差距的增大,片外访存操作的长延迟将造成SMT处理器上越来越明显的资源阻塞和资源滥用。另外,各线程在竞争共享资源的过程中随着程序行为的变化表现出变化的资源需求,适应性不强的资源共享控制策略将很难持续地提供优化的资源分配方案。这些问题使如何合理地控制SMT处理器资源在线程之间的共享显得尤其重要。围绕上述问题,本文在深入研究分析相关工作的基础上,从避免长延迟load依赖指令阻塞共享资源、利用计算访存并发性有效隐藏片外访存长延迟、增强资源共享策略对程序行为变化的适应性、以及避免控制决策运算影响关键流水线路径这四种途径展开研究,并提出了相应的同时多线程处理器资源共享控制策略,通过模拟实验验证了各策略的有效性。主要取得以下研究成果。(1)为避免长延迟load依赖指令阻塞共享资源,提出了长延迟load感知的SMT处理器指令派遣策略DSTALL和DSTALLp。该策略在流水线的派遣阶段实施停止派遣控制决策,根据检测到的或预测到的二级Cache失效信息决定是否停止派遣线程的指令到指令队列。通过避免已取指的长延迟load依赖指令在检测到长延迟load后继续阻塞资源,以及缩短控制决策反馈信息利用延迟的方式,减少了长延迟load给SMT处理器资源共享带来的负面影响。(2)针对隐藏片外访存长延迟的问题,提出了利用计算和访存操作并发性的SMT处理器资源划分策略ECMC。它从SMT处理器利用线程级并行隐藏长操作延迟的本质特性出发,周期性地根据线程计算型访存型操作并发能力来调整共享资源在各线程之间的划分,为在计算操作与片外访存操作并发性方面表现较好的线程分配更多的资源,提高了执行时钟上的计算操作与访存操作并发率,较有效地隐藏了Cache失效load操作的长延迟。(3)为了避免资源分配优化过程陷入局部次优空间,增强在变化的程序行为中持续优化的能力,提出了一种空间触发的耗散式SMT处理器资源分配策略SDRD。该策略的分配优化自组织机制和分配空间上触发的混沌协同工作,通过控制资源分配方案的相似度使资源分配方案能逃离局部极优方案,为程序行为变化的不同阶段提供持续的资源分配优化。在仅以吞吐量为目标的情况下,同时照顾了吞吐量和公平性性能。(4)提出了SMT处理器上非关键路径资源分配器设计模型NCPRD。该模型使资源分配模块独立于处理器关键流水线路径,以避免资源分配在关键流水线路径上的开销给处理器性能带来不可忽略的影响。NCPRD的异步工作模式对于时钟开销较明显的SMT处理器隐式资源共享控制策略也具有参考意义。

论文目录

  • 致谢
  • 摘要
  • Abstract
  • 插图清单
  • 附表清单
  • 1 绪论
  • 1.1 研究背景与意义
  • 1.2 论文主要工作
  • 1.3 论文组织结构
  • 2 相关研究概述
  • 2.1 同时多线程处理器体系结构
  • 2.1.1 SMT处理器基本模型
  • 2.1.2 流水线关键资源的使用
  • 2.1.3 商业SMT处理器
  • 2.2 SMT处理器资源共享竞争
  • 2.2.1 SMT处理器性能模型
  • 2.2.2 影响资源竞争的因素
  • 2.2.3 减少不良资源竞争方法
  • 2.3 SMT处理器资源共享控制策略分类
  • 2.4 SMT处理器资源共享控制策略
  • 2.4.1 取指策略
  • 2.4.2 资源划分
  • 2.4.3 利用存储级并行
  • 2.4.4 复杂资源结构与指令调度机制
  • 2.5 本章小结
  • 3 模拟方法与环境建立
  • 3.1 SMT处理器模拟器
  • 3.1.1 相关模拟器
  • 3.1.2 M-Sim模拟器
  • 3.2 程序负载模拟
  • 3.2.1 测试程序
  • 3.2.2 模拟方法
  • 3.3 评价指标
  • 3.4 本章小结
  • 4 长延迟load感知的同时多线程处理器指令派遣策略
  • 4.1 引言
  • 4.2 长延迟load感知的指令派遣策略
  • 4.2.1 动机与思想
  • 4.2.2 策略设计
  • 4.2.3 实现
  • 4.3 实验方法与设置
  • 4.4 结果与分析
  • 4.4.1 性能比较
  • 4.4.2 DPM指标比较
  • 4.4.3 长延迟load触发延迟
  • 4.5 本章小结
  • 5 利用计算访存并发性的同时多线程处理器资源划分策略
  • 5.1 引言
  • 5.2 计算操作和访存操作的并发性
  • 5.3 利用计算访存并发性的资源划分策略
  • 5.3.1 动机与思想
  • 5.3.2 策略设计
  • 5.3.3 实现
  • 5.4 实验方法与设置
  • 5.5 结果与分析
  • 5.5.1 性能比较
  • 5.5.2 计算型访存型操作并发率
  • 5.5.3 调整步距
  • 5.5.4 指令队列大小影响
  • 5.6 本章小结
  • 6 空间触发的耗散式同时多线程处理器资源分配策略
  • 6.1 引言
  • 6.2 空间触发的耗散式资源分配优化
  • 6.2.1 主要思想
  • 6.2.2 自组织机制
  • 6.2.3 空间上触发的混沌
  • 6.2.4 算法描述
  • 6.2.5 实现
  • 6.3 实验设置
  • 6.4 结果和讨论
  • 6.4.1 L-SDRD与G-SDRD的比较
  • 6.4.2 SDRD与其它策略的比较
  • 6.4.3 利用范围
  • 6.4.4 混沌概率
  • 6.4.5 多样性阈值
  • 6.5 本章小结
  • 7 同时多线程处理器的非关键路径资源共享控制器设计
  • 7.1 引言
  • 7.2 非关键路径资源分配器
  • 7.2.1 资源分配器与关键路径间的交互
  • 7.2.2 非关键路径资源分配器设计
  • 7.3 案例研究
  • 7.3.1 模拟设置
  • 7.3.2 实验结果
  • 7.4 本章小结
  • 8 总结
  • 参考文献
  • 作者简历及在学期间所取得的科研成果
  • 相关论文文献

    • [1].时钟共享多线程处理器存储结构的设计与实现[J]. 微电子学与计算机 2017(01)
    • [2].支持多线程处理器的实时操作系统实现研究[J]. 浙江大学学报(工学版) 2009(07)
    • [3].基于多核多线程处理器的网络设备设计与实现[J]. 电子设计工程 2009(12)
    • [4].同时多线程处理器共享资源的特性分析[J]. 计算机工程与科学 2009(08)
    • [5].时钟共享多线程处理器通信机制的设计与实现[J]. 电子技术应用 2016(03)
    • [6].片上多线程处理器调度策略分析[J]. 工业控制计算机 2016(06)
    • [7].MIPS公布即将推出代号为“Prodigy”的64位多核、多线程处理器IP[J]. 电子与电脑 2011(04)
    • [8].多线程处理器发展浅析[J]. 科技创新导报 2012(01)
    • [9].基于线程级的同时多线程处理器功耗评估[J]. 计算机工程 2010(14)
    • [10].基于芯片多线程处理器的性能测试及分析[J]. 计算机工程 2010(18)
    • [11].面向实时流处理的多核多线程处理器访存队列[J]. 计算机研究与发展 2009(10)
    • [12].MIPS将推出64位多核、多线程处理器IP——Prodigy[J]. 单片机与嵌入式系统应用 2011(05)
    • [13].多核多线程处理器的随机测试流量生成技术[J]. 计算机工程 2009(10)
    • [14].多核多线程处理器XLR732的多核间通信[J]. 重庆工学院学报(自然科学版) 2008(10)
    • [15].同时多线程技术[J]. 计算机工程与设计 2008(04)
    • [16].Arm首款多线程处理器增强驾驶员对大规模部署自动驾驶的安全信任[J]. 单片机与嵌入式系统应用 2019(02)
    • [17].MIPS多线程处理器为Mobileye新款C2-270防撞系统带来强大功能[J]. 单片机与嵌入式系统应用 2011(01)
    • [18].细粒度多线程处理器中前瞻性数据加载的设计与实现[J]. 计算机研究与发展 2011(S1)
    • [19].一种基于AC-Bloom技术的多线程处理器数据存取队列机制设计[J]. 微电子学与计算机 2015(06)
    • [20].多核多线程处理器二级Cache预取结构的设计[J]. 计算机工程与应用 2009(10)
    • [21].嵌入式多线程处理器的执行控制设计方法的研究[J]. 沈阳理工大学学报 2012(04)
    • [22].XMOS公司宣布采用微捷码Talus IC实现软件开发65纳米处理器[J]. 电子元器件应用 2009(02)
    • [23].同时多线程处理器的指令调度器设计[J]. 微电子学与计算机 2016(06)
    • [24].龙芯2号处理器的同时多线程设计[J]. 计算机学报 2009(11)
    • [25].MIPS32 1004K续写MIPS高性能IP[J]. 电子设计应用 2008(06)
    • [26].多核同时多线程处理器的线程调度器设计[J]. 电子技术应用 2016(01)
    • [27].嵌入式硬件多线程处理器设计与多线程机制[J]. 电子技术与软件工程 2015(21)
    • [28].产品推介[J]. 电子产品世界 2008(06)
    • [29].硬件多线程处理器的动态功耗控制方法(英文)[J]. 中国通信 2013(05)
    • [30].多线程处理器资源分配策略[J]. 计算机工程 2008(15)

    标签:;  ;  ;  ;  ;  ;  ;  

    同时多线程处理器资源共享控制策略研究
    下载Doc文档

    猜你喜欢