单机检查点系统平台相关性研究及性能优化

单机检查点系统平台相关性研究及性能优化

论文题目: 单机检查点系统平台相关性研究及性能优化

论文类型: 硕士论文

论文专业: 计算机系统结构

作者: 李艳红

导师: 孟丹

关键词: 机群系统,容错,检查点系统,存储策略

文献来源: 中国科学院研究生院(计算技术研究所)

发表年度: 2005

论文摘要: 机群系统的规模增大,部件增多,导致了机群的组合错误率也不断上升。节点失效使运行于机群节点上的作业面临中途失败,从而造成巨大的资源浪费,甚至导致大的作业无法完成。检查点系统为节点提供了较好的容错性能,因此成为机群操作系统软件的重要组成部分。通过建立单机检查点系统可以提高操作系统的可靠性,减少运算损失,同时也为构造其他容错软件,甚至是建立整个机群环境的并行检查点系统提供基础。本文主要针对单机检查点系统的实现技术进行研究,并以曙光4000系列机群为平台,重点讨论了系统级检查点的平台相关性和性能优化策略。曙光4000A中使用的Opteron是基于AMD公司的x86-64架构的处理器。目前还没有开源的检查点系统对该体系结构提供过支持或者相关技术探讨。本文首先分析比较了现有检查点系统,对检查点实现技术进行深入研究,重点讨论了系统级检查点BLCR的实现机制。然后通过对x86-64体系结构的分析,实现了BLCR对AMD Opteron的支持,并对系统级检查点的平台相关性进行了探讨。最后提出了两种检查点系统中进程地址空间的优化存储策略。其中组合式检查点文件写策略解决了并发写机制在应用内存接近物理内存时的性能突降问题,A-O(Access-Order)进程地址空间存储策略调整传统地址空间的存储顺序,使大内存应用的检查点操作性能得到了大幅度提升。实验表明,A-O进程地址空间存储策略最高可以将传统的存储策略的时间开销缩减至原来的50%。

论文目录:

论文摘要

英文摘要

第1章 绪论

1.1 研究背景

1.2 课题来源

1.3 研究内容

1.4 论文结构

第2章 检查点研究现状

2.1 检查点系统的外部使用机制

2.2 单机检查点的内部实现机制

2.2.1 用户级检查点

2.2.2 系统级检查点

2.2.3 两种实现机制的分析比较

2.3 商用检查点系统

2.3.1 IBM 的 AIX

2.3.2 SGI 的 IRIX

2.4 并行检查点技术

2.4.1 消息传递系统全局一致状态

2.4.2 并行检查点协议分类

2.4.3 并行检查点系统

2.5 检查点系统性能评价标准

2.6 检查点系统设计原则

2.6.1 系统的通用性

2.6.2 系统的扩充性

2.6.3 系统的可移植性

2.6.4 系统的灵活性

2.6.5 系统的异常处理能力

2.7 本章总结

第3章 检查点系统实现技术

3.1 进程的上下文信息

3.2 进程上下文存取技术

3.2.1 CPU 寄存器状态

3.2.2 进程地址空间

3.2.3 信号

3.2.4 文件

3.2.5 进程间通信

3.2.6 其他进程状态

3.3 典型检查点系统分析比较

3.3.1 检查点系统分析

3.3.1.1 libckpt

3.3.1.2 Condor

3.3.1.3 VMADump

3.3.1.4 Epckpt

3.3.2 检查点系统比较

3.4 系统级检查点BLCR 流程分析

第4章 系统级检查点平台相关性

4.1 LINUX 中相对稳定的管理机制

4.2 CPU 相关性研究

4.2.1 x86-64 体系结构新特性介绍

4.2.2 对64 位扩展的支持

4.2.3 对四级页表结构的支持

4.2.4 对快速系统调用指令的支持

4.2.5 其他特性

4.3 LINUX 内核版本变化对检查点的影响

第5章 组合式检查点文件写策略

5.1 写文件的行为分析

5.2 组合式写策略

5.3 实验结果及性能分析

5.4 其他性能优化方法

第6章 AO 进程地址空间存储策略

6.1 按照虚存地址高低次序的存储策略分析

6.2 按照页面访问次序(ACCESS-ORDER)的存储策略分析

6.3 实验结果及性能分析

第7章 总结及工作展望

7.1 总结

7.2 工作展望

参考文献

致谢

作者简历

发布时间: 2006-12-26

参考文献

  • [1].基于中间结果检查点的MapReduce容错方法研究与实现[D]. 丁凯.内蒙古大学2017
  • [2].面向并行微重启的检查点优化方法[D]. 谷雷.哈尔滨工程大学2017
  • [3].基于增量检查点进程迁移机制研究[D]. 安丰姣.哈尔滨工程大学2015
  • [4].面向星载计算机的检查点容错技术研究[D]. 刘茵竺.上海交通大学2011
  • [5].增量检查点设置与卷回恢复技术研究[D]. 卢鹏飞.哈尔滨工程大学2014
  • [6].移动计算环境下检查点存储管理技术研究[D]. 胡亭.哈尔滨工程大学2014
  • [7].基于VxWorks的检查点容错技术研究[D]. 李志顺.吉林大学2014
  • [8].基于快照的虚拟磁盘镜像检查点系统[D]. 何艳丽.华中科技大学2013
  • [9].分布式系统中基于检查点容错服务的设计与实现[D]. 黄志勇.东南大学2016
  • [10].移动计算环境下检查点存储策略的研究[D]. 蒋坚鸿.哈尔滨工程大学2012

相关论文

  • [1].计算网格环境下基于检查点的进程迁移机制研究[D]. 曾科宏.中国石油大学2007
  • [2].利用分布式检查点和消息日志技术解决节点故障问题的设计与实现[D]. 蒋承盛.吉林大学2007
  • [3].基于共享主存计算机的含错与动态检查点技术研究[D]. 袁宁.国防科学技术大学2006
  • [4].高可用性系统中检查点技术的研究与实现[D]. 周国峰.华中科技大学2004
  • [5].CONDOR系统检查点机制的应用与开发[D]. 魏晓丹.吉林大学2005
  • [6].计算机免疫系统GECISM中检查点技术及实现[D]. 杨绍芸.河北大学2005
  • [7].支持用户层异步检查点通讯工具[D]. 郝冠普.吉林大学2005
  • [8].面向网格应用的检查点技术的研究[D]. 张桢夏.浙江大学2006
  • [9].机群环境下支持文件访问的检查点技术的研究与实现[D]. 王亮.中国科学院研究生院(计算技术研究所)2006
  • [10].基于WinNT进程检查点技术研究与实现[D]. 梁蓓.湖南大学2004

标签:;  ;  ;  ;  

单机检查点系统平台相关性研究及性能优化
下载Doc文档

猜你喜欢