空间辐射环境下软件实现的硬件故障检测技术研究

空间辐射环境下软件实现的硬件故障检测技术研究

论文摘要

当前,世界上太空探索的热潮再度兴起。人类探索太空的活动更加活跃的同时,太空辐射环境对探测器可靠性的负面影响也日益突出。空间辐射环境对电子器件的影响可分为单粒子效应和总剂量效应两类,其中单粒子效应尤其是单粒子翻转故障构成了对星载计算机安全的主要威胁。相关研究结果表明,相对于使用抗辐照器件的硬件容错技术,采用软件容错技术,即在商用器件上采用软件的方法容忍硬件故障,可以在保证系统可靠性的前提下,获得更高的系统性能。软件容错技术同时也具有低成本、低功耗、可灵活配置等优点。本文在分析当前已有软件容错技术成果的基础上,围绕故障检测算法、容错优化技术进行了深入研究。首先,本文提出了一种新的故障检测技术——基于层次分解的故障检测技术。不同于其它已有的故障检测技术,基于层次分解的故障检测技术将程序结构划分为不同的层次,并在不同的层级上使用不同的故障检测算法,通过这些检测算法相互配合、层层检测,实现了对不同种类故障、不同类型的程序错误进行检测,提高了程序运行的可靠性。然后,本文根据程序不同区域在应用故障检测算法后通常在可靠性和性能方面具有不同反应的特点,提出了一种可配置的故障检测算法。算法建立了容错程序的可靠性反应和性能反应分析模型,并基于分析结果获得具有最佳性价比的容错配置方案。最后,本文基于编译容错的思路,实现了基于层次分解的故障检测技术和可配置的故障检测算法,并通过故障注入实验对这些技术的故障检测能力和性能代价进行了测试。基于层次分解的故障检测技术对硬件故障的检测率达到了97.9%-99.1%。相比基于层次分解的故障检测技术,可配置的故障检测算法以0.5%-1.4%的故障检测率损失为代价,使容错的性能消耗下降了12%-20%。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 本文主要工作
  • 1.3 论文结构
  • 第二章 技术背景
  • 2.1 容错技术概述
  • 2.1.1 容错技术相关概念
  • 2.1.2 软件容错技术
  • 2.2 控制流校验技术
  • 2.2.1 控制流校验概述
  • 2.2.2 相关工作
  • 2.3 软件复算技术
  • 2.3.1 软件复算技术原理
  • 2.3.2 主要研究工作
  • 2.3.3 其它研究
  • 2.4 容错实现与验证技术
  • 2.4.1 容错实现技术
  • 2.4.2 容错验证技术
  • 第三章 基于层次分解的故障检测技术
  • 3.1 FDTPH 技术概述
  • 3.1.1 相关定义
  • 3.1.2 FDTPH 技术基本原理
  • 3.1.3 FDTPH 技术分析
  • 3.2 基于逆向恢复的故障检测算法
  • 3.2.1 EDCC 算法原理
  • 3.2.2 可恢复运算指令
  • 3.2.3 程序等价变换
  • 3.2.4 EDCC 实现算法
  • 3.2.5 EDCC 算法优缺点分析
  • 3.3 基于ECC 的存储错误检测算法
  • 3.3.1 SFDE 基本原理
  • 3.3.2 SFDE 实现算法
  • 3.3.3 SFDE 小结
  • 3.4 基于可靠标签的控制流校验算法
  • 3.4.1 静态标签的设计
  • 3.4.2 控制流错误检测原理
  • 3.4.3 CFCRS 实现算法
  • 3.4.4 CFCRS 控制流错误检测能力分析
  • 第四章 故障检测的优化技术
  • 4.1 容错优化概论
  • 4.2 可配置的故障检测算法
  • 4.2.1 程序容错特征分析
  • 4.2.2 可靠性反应分析模型
  • 4.2.3 性能反应模型及容错优化
  • 4.2.4 CFDA 小结
  • 第五章 容错算法的实现和验证
  • 5.1 容错转换系统总体设计
  • 5.2 容错转换系统详细设计
  • 5.2.1 寄存器分配策略
  • 5.2.2 容错转换系统数据结构设计
  • 5.2.3 容错转换实例分析
  • 5.3 故障注入实验结果及分析
  • 5.3.1 实验条件
  • 5.3.2 实验结果
  • 5.3.3 实验结论
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 相关论文文献

    标签:;  ;  

    空间辐射环境下软件实现的硬件故障检测技术研究
    下载Doc文档

    猜你喜欢