基于寄生式故障检测的分布式并行服务器系统容错技术

基于寄生式故障检测的分布式并行服务器系统容错技术

论文题目: 基于寄生式故障检测的分布式并行服务器系统容错技术

论文类型: 博士论文

论文专业: 计算机应用技术

作者: 左朝树

导师: 刘心松

关键词: 分布式并行服务器系统,预测复本控制算法,寄生式故障检测算法,分布式并行容错算法

文献来源: 电子科技大学

发表年度: 2005

论文摘要: 随着经济的全球化发展,特别是电子商务的出现,工业经济不断向知识经济转变,企业对信息具有重大的依赖性。目前的服务器系统在可靠性方面不能完全满足这种需求,研制具有强容错能力的服务器系统具有重要的意义。该课题将容错技术、分布式技术、并行处理技术、网络技术等相互融合,提出了分布式并行服务器系统的体系结构,并基于该体系结构研究多模型预测复本控制机制和基于寄生式故障检测的容错机制,能实现服务器系统的“永不停顿”。 文章在研究集群Web服务器系统和分布式并行数据库系统基础上,结合分布式系统、并行处理系统等相关概念,给出了分布式并行服务器系统的定义,并根据容错处理的需要研究了系统结构及相关模块。分布式并行服务器系统由四个部分组成:接口系统、执行系统、通信系统和管理系统。接口系统负责服务器系统与客户端的交互,执行系统负责完成用户的任务请求,通信系统负责节点间的信息交换,而管理系统负责整个系统的管理和维护。 在分布式并行服务器系统中,复本控制机制在保证用户数据可用性的前提下尽可能提高系统的资源利用率。在研究前人成果基础上,文章提出了预测复本控制算法。该算法通过选择合适的数学模型来预测各个节点未来可能达到的任务量,以此作为依据并在保证可用性的前提下,采用多目标优化策略确定数据的冗余度和驻留节点。该算法比纯基于过去或现在任务情况部署复本的一些复本控制算法,具有较高的准确性,并对系统资源利用率有较大的提高。 为了实现分布式并行服务器系统的容错,文章在研究现行故障检测技术基础上,提出了寄生式故障检测算法。该算法通过监测系统内节点间的信息交换,并以动态的时间阈值确定故障节点,与其它检测算法相比能明显地减少系统的通信开销。在节点出现故障时,通过动态重构任务执行过程中的主代理或辅代理等,系统保证当前正在执行的任务不会被终止,以提高系统的可靠性及可用性,实现故障透明。同时,系统通过数据动态重构和系统动态重构将故障节点隔离,使整个系统运行在正常状态。系统利用该机制可实现服务器节点的动态在线加入和退出,从而实现在线维护,使系统具有“永不停顿”的能力。 最后,文章对分布式并行服务器系统的可靠性及可用性、平均响应时间进

论文目录:

摘要

Abstract

第一章 引言

1.1 容错技术的发展及现状

1.1.1 发展史

1.1.2 研究现状

1.2 容错技术研究背景及意义

1.2.1 研究背景

1.2.2 研究意义

1.3 论文创新性研究的内容及目标

1.4 论文组织结构

第二章 容错技术综述

2.1 相关概念

2.1.1 故障、差错及失效

2.1.2 容错

2.1.3 性能评估参数

2.2 容错技术分类

2.2.1 现行分类方法

2.2.2 根据冗余对象划分

2.2.3 根据实现方式划分

2.3 容错技术发展趋势

2.4 小结

第三章 分布式并行服务器系统

3.1 两类多处理机服务器系统

3.1.1 集群Web服务器系统

3.1.2 分布式并行数据库系统

3.1.3 两类服务器系统比较

3.2 分布式并行服务器系统的概念

3.2.1 分布式系统的定义

3.2.2 并行处理系统的定义

3.2.3 分布式并行服务器系统的定义

3.3 分布式并行服务器系统体系结构

3.3.1 体系结构

3.3.2 用户数据分布

3.4 分布式并行服务器系统的节点动态管理

3.4.1 设计目标

3.4.2 节点目录

3.4.3 节点操作

3.5 分布式并行服务器系统的信息交换

3.5.1 通信系统结构

3.5.2 消息发送

3.5.3 消息接收

3.6 分布式并行服务器系统的任务处理

3.6.1 任务描述及处理

3.6.2 任务执行系统结构

3.6.3 任务执行过程

3.7 容错思想

3.7.1 自然界的启示

3.7.2 容错原理

3.8 小结

第四章 多模型预测复本控制机制

4.1 数据复本的作用

4.2 数据目录

4.2.1 目录结构

4.2.2 目录操作

4.3 复本控制技术研究现状及需解决的问题

4.3.1 研究现状

4.3.2 需解决的问题

4.4 预测复本控制算法

4.4.1 预测模型库

4.4.2 样本采集

4.4.3 任务量预测

4.4.4 冗余分布决策

4.4.5 算法描述

4.4.6 负载平衡策略

4.5 对比分析及测试

4.5.1 对比分析

4.5.2 测试及分析

4.6 小结

第五章 基于寄生式故障检测的容错机制

5.1 容错机制的目标及基本原理

5.1.1 目标

5.1.2 基本原理

5.2 容错数据结构

5.2.1 任务表

5.2.2 子任务表

5.2.3 表的维护和使用

5.3 寄生式故障检测算法

5.3.1 故障检测算法研究现状

5.3.2 故障检测算法评价指标

5.3.3 AFD算法原理

5.3.4 AFD算法描述

5.4 分布式并行容错算法

5.4.1 算法基本思想

5.4.2 辅代理动态重构过程

5.4.3 主代理动态重构过程

5.4.4 会话动态重构过程

5.4.5 系统动态重构过程

5.5 容错机制的特点

5.6 小结

第六章 分布式并行服务器系统性能分析及模拟测试

6.1 可靠性及可用性

6.1.1 可靠性

6.1.2 可用性

6.2 平均响应时间

6.2.1 平均响应时间分析

6.2.2 影响因素分析

6.2.3 对比分析

6.3 模拟测试

6.4 小结

第七章 结论及进一步的工作

7.1 论文工作总结

7.2 进一步的研究工作

参考文献

致谢

个人简历、在学期间的研究成果及发表的学术论文

发布时间: 2006-11-28

参考文献

  • [1].可扩展、高性能Web服务器系统的研究[D]. 雷迎春.中国科学院研究生院(计算技术研究所)2002
  • [2].基于应用层和传输层的网络测量分析研究[D]. 张敏.北京交通大学2012

相关论文

  • [1].高可靠容错实时系统的支撑技术研究[D]. 陈宇.电子科技大学2001
  • [2].基于CORBA的分布式系统中实时—容错性的研究——分布式系统中动态调度的设计与实现[D]. 彭舰.电子科技大学2004
  • [3].故障诊断与容错技术及其在组合导航系统中的应用研究[D]. 钱华明.哈尔滨工程大学2004
  • [4].故障诊断与容错控制方法研究[D]. 王德军.吉林大学2004
  • [5].高性能并行计算机互联网络容错模型及其路由算法研究[D]. 王雷.湖南大学2005
  • [6].容错实时系统可调度性分析研究[D]. 王磊.浙江大学2005
  • [7].复杂非线性系统故障检测与故障预报[D]. 张正道.南京航空航天大学2006
  • [8].机群系统容错中间件技术研究[D]. 黄伟.中国科学院研究生院(计算技术研究所)2005
  • [9].大规模分布式仿真系统容错关键技术研究[D]. 刘云生.国防科学技术大学2006
  • [10].分布式系统故障检测的关键技术研究[D]. 董剑.哈尔滨工业大学2007

标签:;  ;  ;  ;  

基于寄生式故障检测的分布式并行服务器系统容错技术
下载Doc文档

猜你喜欢