高端容错计算系统高可靠监控子系统的研究和设计

高端容错计算系统高可靠监控子系统的研究和设计

论文摘要

高端容错计算系统是关键应用领域中的重要信息化设备,此类系统一方面具有较强的事务处理能力,另外一方面具有较高的可靠性,可长期提供高速、稳定的信息处理服务。高端容错计算系统中任何信息的丢失和破坏、异常停机都会产生重大影响,因而要求系统有连续运行的能力,即高可用性。本文以研究刀片服务器系统这样的高端容错计算系统为基础,利用双机容错系统的方法和技术,完成了其高可靠监控子系统的设计,从而达到了刀片服务器系统的高可用。监控子系统可以选择多刀片中的任意两个计算刀片,这样它们一起组成一个高可用的Leader层。监控子系统采用三模冗余的高可靠设计技术,使Leader层成为刀片系统的高可用的核心。监控子系统仲裁过程的成功与否是影响容错计算系统可用性的主要方面。当选择的两Leader刀片均正常时,服务的提供与单机系统几乎完全相同。只有发生严重故障时,Leader层可以进行重构,可以继续使用好的计算刀片对外提供服务,从而显示出相对于单机系统的优越性。但是如果仲裁过程不成功,则Leader层系统与单机系统相比没有任何优势。通过对仲裁过程进行了分析,建立考虑中间处理过程成功率的马尔可夫模型,并进行典型系统分析,综合热备份系统和互备援系统,得到结论:多刀片容错计算系统在对需要进行系统重构的故障进行处理中,故障检测、故障诊断两个过程是至关重要的。本文研究了常用的仲裁技术,分析了实际的系统需求与现有技术的冲突,在实际需求的基础上,提出了一种高可用的监控机制,在整个监控过程中提供硬件支持,完成了对高端容错计算系统高可靠监控子系统的硬件设计工作,实现了三模表决、CPLD、USB多路选择、热插拔等具体技术。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 论文中涉及的重要概念
  • 1.2.1 故障
  • 1.2.2 可靠性及相关概念
  • 1.3 常用服务器高可用技术介绍
  • 1.3.1 硬件冗余技术
  • 1.3.2 纠检错编码技术
  • 1.3.3 软件容错技术
  • 1.4 论文研究内容及结构
  • 第2章 高可靠监控子系统仲裁机制研究
  • 2.1 仲裁过程
  • 2.2 传统的仲裁技术
  • 2.3 双机容错系统可用性分析
  • 2.3.1 传统的双机系统可用性模型
  • 2.3.2 互备援系统可用性模型
  • 2.3.3 热备份系统可用性模型
  • 2.4 本章小结
  • 第3章 高端容错计算系统的结构及监控机制
  • 3.1 系统设计要求
  • 3.2 高端容错计算系统的结构及容错机制
  • 3.2.1 硬件结构
  • 3.2.2 软件结构
  • 3.2.3 系统容错机制
  • 3.3 高可靠监控机制
  • 3.3.1 监控子系统基本设计原理
  • 3.3.2 监控子系统示意图
  • 3.3.3 监控子系统的故障检测
  • 3.3.4 监控子系统工作原理
  • 3.4 本章小结
  • 第4章 高可靠监控子系统设计和实现
  • 4.1 功能需求分析
  • 4.2 监控子系统的硬件结构设计
  • 4.3 监控节点间的总线通信及控制
  • 4.3.1 总线介绍
  • 4.3.2 总线通信策略
  • 4.4 USB选择部件的设计
  • 4.4.1 切换芯片的选择
  • 4.4.2 USB选择部件的实现
  • 4.4.3 USB选择部件和单片机的连接
  • 4.5 CPLD的设计
  • 4.5.1 功能介绍
  • 4.5.2 具体命令定义
  • 4.5.3 时钟控制电路
  • 4.5.4 切换控制
  • 4.5.5 看门狗
  • 4.6 CPCI热插拔实现
  • 4.7 监控子系统可靠性评价
  • 4.7.1 常用可靠性评价方法
  • 4.7.2 监控子系统可靠性评价
  • 4.8 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].第14届全国容错计算学术会议征文通知[J]. 计算机工程与科学 2011(04)
    • [2].第14届全国容错计算学术会议征文通知[J]. 计算机工程与科学 2011(05)
    • [3].第十三届全国容错计算学术会议征文通知[J]. 计算机工程与设计 2009(06)
    • [4].“第十六届全国容错计算学术会议(CFTC2015)”圆满闭幕[J]. 信息网络安全 2015(08)
    • [5].2019年度CCF活动计划(部分)[J]. 计算机应用 2019(08)
    • [6].第八届全国测试学术会议成功召开[J]. 信息网络安全 2014(08)
    • [7].微电子测试和容错计算领域国际学术带头人 闵应骅[J]. 中国高新技术企业 2010(03)
    • [8].前言[J]. 计算机研究与发展 2010(S1)
    • [9].百尺竿头思进步 千云深处尚虚心——访清华大学软件学院向东教授[J]. 今日科苑 2008(03)
    • [10].计算机可信性系统运行的可信性评测与管理方法[J]. 电大理工 2012(03)
    • [11].创刊30周年1981—2011历任主编题词[J]. 计算机应用 2011(03)
    • [12].一种基于COTS硬件的安全苛求计算平台研究[J]. 北京理工大学学报 2008(03)
    • [13].2015年(7-8月份)CCF活动计划[J]. 计算机应用研究 2015(06)
    • [14].第六届中国测试学术会议征文[J]. 计算机工程与设计 2010(06)
    • [15].来自女计算机科学家的光彩——记中科院计算技术研究所李华伟研究员[J]. 科学中国人 2012(04)
    • [16].一种改进的同步检查点设置算法[J]. 计算机技术与发展 2009(08)
    • [17].人工免疫在入侵检测中应用[J]. 科技信息(科学教研) 2008(11)
    • [18].图形处理器通用计算关键技术研究综述[J]. 计算机学报 2013(04)

    标签:;  ;  ;  

    高端容错计算系统高可靠监控子系统的研究和设计
    下载Doc文档

    猜你喜欢