同步数据触发体系结构多核处理器存储系统关键技术研究

同步数据触发体系结构多核处理器存储系统关键技术研究

论文摘要

采用多核体系结构能够提高处理器的性能,但多核处理器中有多个处理器核访问存储器,对存储系统带宽需求增加,“存储墙”问题表现更为突出,给存储系统设计带来了挑战。本文全面分析了同步数据触发体系结构(Synchronous Data Triggered Architecture,SDTA)下典型应用程序的数据访问特征,在上述分析基础上,围绕同步数据触发体系结构多核处理器存储系统相关的一系列关键技术展开研究,取得了相关的研究成果,对提高多核处理器整体性能具有重要意义。本文所取得的研究成果主要有:1、研究多核处理器存储层次,提出了一种基于“生产—消费”关系的多核处理器存储层次评估模型。比较了不同共享级别条件下多核处理器的性能,确定了在二级Cache级别进行共享。根据数据访问请求处理的“生产—消费”特性,使用排队理论建立了一种存储层次评估模型,用于分析存储层次的配置,指导存储层次优化。通过该模型可以评估存储层次不同参数对于处理器性能影响的趋势,在处理器设计早期给出存储层次设计的参数选择范围,得出初步的性能估计,从而调整处理器存储层次结构,优化设计。2、提出了面向多核处理器的点到点数据预送技术,设计了支持点到点数据预送的传输引擎。为解决多核处理器中的一对多数据消费关系问题,针对以往C/S模式数据预送技术在一对多传输情况下对传输网络利用率不高且发送节点容易成为瓶颈的缺点,研究了点到点数据预送技术,提出了点到点协作通信模型,并设计了支持点到点数据预送的传输引擎。理论分析和实际测试均表明采用点到点数据预送技术能够有效提升处理器性能。3、提出了基于同步存储器的多核同步技术和基于指令Cache作废的多核同步技术。(1)针对典型的基于共享Cache结构下的锁同步操作涉及到资源竞争、Cache一致性维护等问题,为较好的支持释放一致性模型,提高处理器性能,提出了基于同步存储器的多核同步技术,设计了相应的同步功能单元和同步控制单元,利用SDTA结构特性可以将同步功能单元方便的连入计算核中,对所提同步技术进行有效支撑。该同步技术提供了专门的同步通路,不干扰正常的访存过程,降低了对下层存储器的带宽需求,有利于处理器性能的发挥。测试表明其性能优于典型的基于共享Cache结构下的锁同步技术。(2)使用基于同步存储器的同步技术进行同步,在同步核数量较多情况下,仍会有同步存储器访问竞争问题,同步延迟会有所增加,针对这一问题,又提出了基于指令Cache作废的多核同步技术,通过作废将要执行的指令Cache行达到同步的目的。该方法利用了处理器中本来的访存通路,在取指失效时向L2 Cache发取指请求,在L2 Cache中设置相应的过滤机制,通过不同的服务策略达到不同的同步目的。测试表明,该方法的可扩展性较好,性能也和提供专门的同步存储器性能相当。4、根据同步数据触发体系结构指令集的特性,提出了适合其指令特性的软硬件结合的指令预取策略,并设计了支持相应预取策略的指令Cache;针对多核条件下存储访问具有存储级别并行性的特点,提出了着眼于优化执行开销的L2 Cache替换算法,并设计了L2 Cache,支持所提出的基于指令Cache作废的同步技术;设计了一种可配置的数据Cache,既可以配置成数据Cache,也可以配置成Scratchpad局部存储器,从而为具有不同数据访问特性的程序提供有针对性的有效存储结构。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 课题研究背景
  • 1.1.1 多核处理器与存储墙
  • 1.1.2 应用需求对高性能处理器体系结构的挑战
  • 1.1.3 深度并行开发与同步数据触发体系结构
  • 1.2 课题研究内容
  • 1.3 相关研究工作现状
  • 1.3.1 多核处理器存储层次结构
  • 1.3.2 数据前瞻技术
  • 1.3.3 多核同步技术
  • 1.3.4 Cache 存储层次优化技术
  • 1.3.5 数据触发体系结构的相关研究
  • 1.4 本文所做的工作
  • 1.5 论文结构
  • 第二章 应用程序存储特征和需求分析
  • 2.1 典型程序集合的选取
  • 2.2 分析环境
  • 2.3 典型程序存储特征分析
  • 2.3.1 单核结构下存储特性分析
  • 2.3.2 多核共享存储结构下存储特性分析
  • 2.3.3 对存储系统设计优化的启示
  • 2.4 本章小结
  • 第三章 一种多核处理器存储层次模型
  • 3.1 共享存储层次研究
  • 3.2 基于“生产-消费”关系的存储层次模型
  • 3.2.1 单核处理器简单模型
  • 3.2.2 不同存储资源类型
  • 3.2.3 单核处理器模型描述
  • 3.2.4 多核处理器评估模型
  • 3.2.5 不同输入参数对性能的影响
  • 3.3 本章小结
  • 第四章 面向多核处理器的点到点数据预送技术
  • 4.1 数据预送技术
  • 4.1.1 P2P 技术分析
  • 4.1.2 P2P 协作通信模型
  • 4.2 支持点到点数据预送的传输引擎设计
  • 4.3 点到点数据预送性能分析和测试
  • 4.4 本章小结
  • 第五章 降低访存压力的多核同步技术
  • 5.1 存储一致性模型
  • 5.1.1 顺序一致性存储模型
  • 5.1.2 弱一致性存储模型
  • 5.1.3 处理器一致性存储模型
  • 5.1.4 释放一致性存储模型
  • 5.2 基于同步存储器的多核同步技术
  • 5.2.1 同步机制
  • 5.2.2 具体实现
  • 5.2.3 性能分析
  • 5.3 基于指令Cache 作废的多核同步技术
  • 5.3.1 同步机制
  • 5.3.2 具体实现
  • 5.3.3 性能分析
  • 5.4 本章小结
  • 第六章 存储系统优化技术及存储系统设计
  • 6.1 指令Cache 设计及优化
  • 6.1.1 相关研究
  • 6.1.2 SDTA 指令特性分析
  • 6.1.3 预取策略
  • 6.1.4 实验结果
  • 6.1.5 小结
  • 6.2 可配置的数据Cache 设计
  • 6.2.1 数据Cache 结构
  • 6.2.2 可配置设计
  • 6.3 L2 Cache 设计及优化
  • 6.3.1 L2 Cache 部件结构
  • 6.3.2 L2 Cache 流水处理
  • 6.3.3 L2 Cache 替换算法
  • 6.4 MMU 设计
  • 6.5 整体性能评测
  • 6.6 本章小结
  • 第七章 结束语
  • 7.1 工作总结
  • 7.2 工作展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 附录A MMU 寄存器列表
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    同步数据触发体系结构多核处理器存储系统关键技术研究
    下载Doc文档

    猜你喜欢