基于MAS分布式ETL系统容错的研究与实现

基于MAS分布式ETL系统容错的研究与实现

论文摘要

随着信息化的深入,企业积累了海量的业务数据,由于这些业务数据存在异构性、不一致性,所以企业无法直接利用这些业务数据,而失去了在竞争的优势。ETL(即数据抽取、转换、加载)工具将面向日常业务的数据转化为面向决策型的数据仓库存储的数据,为企业的管理决策提供可靠的依据。因为ETL工具面临企业海量的业务数据,所以,对数据仓库中ETL工具的执行效率和稳定性要求也越来越高。海量数据的集成对ETL系统的可靠性提出了更高要求。为了提高在数据集成过程中ETL系统的稳定性和可靠性,本文将双备份技术引入ETL系统,设计了一个协调控制服务器双备份的解决方案,克服了目前ETL系统单一协调控制服务器的缺陷,提高ETL系统的稳定性和可靠性。当ETL系统遇到软硬件故障时,主协调控制服务器无法为用户提供应用服务,备用协同控制服务器就接管主协调控制服务器所提供的服务继续为用户提供服务,防止ETL系统中断数据的集成。同时,为了让ETL系统专注于其业务逻辑,因此将日志功能提取出来,形成公用的模块——日志模块,以满足分布式ETL系统对日志功能的要求。本文利用多Agent技术和分布式协同机制,实现分布式ETL系统的日志管理。本文针对ETL作业故障恢复,提出了ETLBatch算法。当某台计算服务器执行ETL作业发生故障时,协调控制服务器将该台计算服务器上故障的ETL作业发送给其他可用的计算服务器并调用ETLBatch算法执行该作业,使得中断的ETL作业能够从故障点继续执行,避免了该ETL作业重新执行,节省了ETL作业故障恢复的开销,保证了ETL系统作业故障恢复的效率。实验结果表明,当ETL系统在执行ETL作业时发生故障时,ETLBatch算法有较好的恢复效率。本文在深入研究多Agent技术、协同控制服务器双备份技术、分布式日志管理技术、ETL作业容错处理技术的基础上,设计并实现了一种具有容错性的ETL系统一-FTETL,为中小型企业提供一个可靠性高的ETL系统。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究的背景及意义
  • 1.2 国内外研究现状及发展趋势
  • 1.3 本文的主要工作
  • 1.4 论文的组织
  • 第二章 相关技术和理论研究
  • 2.1 多Agent系统
  • 2.1.1 多Agent系统概念
  • 2.1.2 多Agent系统结构
  • 2.1.3 JADE平台及体系结构
  • 2.2 服务器双备份
  • 2.2.1 服务器双备份的实现模式
  • 2.2.2 服务器双备份的工作模式
  • 2.3 容错处理的相关策略
  • 2.3.1 错误回卷恢复
  • 2.3.2 恢复块方法
  • 2.4 本章小结
  • 第三章 一种具有容错的ETL系统的总体设计
  • 3.1 设计目标
  • 3.1.1 功能性设计目标
  • 3.1.2 性能方面设计目标
  • 3.2 系统网络拓扑结构
  • 3.3 系统体系结构
  • 3.3.1 客服端设计
  • 3.3.2 协调控制服务器设计
  • 3.3.3 计算服务器设计
  • 3.4 本章小结
  • 第四章 协同控制服务器双备份设计与实现
  • 4.1 协同控制服务器双备份设计
  • 4.1.1 服务器双备份监听模块的设计
  • 4.2 协同控制服务器双备份实现
  • 4.2.1 计算服务器间通信的实现
  • 4.2.2 监听功能的实现
  • 4.2.3 监听线程启动备用服务器的实现
  • 4.2.4 计算服务器重新注册功能的实现
  • 4.3 本章小结
  • 第五章 ETL作业故障恢复设计与实现
  • 5.1 定义
  • 5.2 日志机制
  • 5.2.1 日志模块的整体框架设计
  • 5.2.2 日志模块的实现
  • 5.3 ETL作业故障恢复算法
  • Batch算法'>5.3.1 ETLBatch算法
  • 5.4 FTETL系统ETL作业执行流程
  • 5.5 本章小结
  • 第六章 测试与分析
  • 6.1 FTETL系统客户端设计界面
  • 6.1.1 元数据库配置界面
  • 6.1.2 登入
  • 6.1.3 数据库连接配置界面
  • 6.1.4 源表与目标表的导入
  • 6.1.5 设计作业
  • 6.1.6 调度设计界面
  • 6.2 协调控制服务器
  • 6.2.1 启动监听线程
  • 6.2.2 主服务器
  • 6.2.3 备用服务器启动
  • 6.3 计算服务器
  • 6.4 恢复算法性能测试与分析
  • 6.5 本章小结
  • 结论与展望
  • 参考文献
  • 致谢
  • 个人简历、在学期间的研究成果及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  

    基于MAS分布式ETL系统容错的研究与实现
    下载Doc文档

    猜你喜欢