异构数据集成技术研究

异构数据集成技术研究

论文摘要

随着计算机技术和网络技术的迅速发展,企业在信息化建设过程中,构建了许多信息系统来管理企业数据。这些信息系统内部的数据带有明显的分布性、自制性和异构性。为了保证对企业内部及企业之间信息进行共享、维护和管理,必需寻找一种对分布、异构的数据进行统一操作的方法。异构数据集成系统为企业解决多平台、多应用、多结构、多语义数据的集成问题提供了一条解决途径。通过这样一个集成系统,不仅可以把企业内部的各种相关数据资源进行整合,而且可以收集企业外部相关信息,为企业的决策提供支持。因此,异构数据集成受到越来越多人的重视,这一方面的研究已经成为热点,也是本文的研究目的。本文研究了异构数据集成的方法和技术。首先分析了异构数据的特性,指出了异构数据集成需要解决的问题;接着提出了一个基于中介器/包装器技术的异构数据集成方案,结合XML技术设计了系统的公共数据模型和数据字典;然后详细研究了查询处理和包装器等关键模块,实现了查询分解算法,并以关系包装器为例,实现了包装器的功能;针对异构数据集成系统中包装器设计难的问题,本文采用规则树实现了Web包装器半自动生成的技术方案。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 本文的创新点
  • 1.4 本文的研究内容
  • 第二章 数据集成技术
  • 2.1 异构数据的特点
  • 2.2 XML与异构数据集成
  • 2.2.1 XML模式与解释器
  • 2.2.2 XML查询语言XQuery
  • 2.2.3 XML与异构数据集成
  • 2.3 异构数据集成方法研究
  • 2.3.1 模式集成
  • 2.3.2 数据集成
  • 2.4 基于中介器/包装器技术的集成方案
  • 2.4.1 集成方案的体系结构
  • 2.4.2 须解决的关键问题
  • 2.5 本章小结
  • 第三章 一个异构数据集成系统的设计
  • 3.1 系统设计目标
  • 3.2 系统整体框架结构
  • 3.3 系统组成功能模块
  • 3.3.1 模式管理器
  • 3.3.2 查询处理器
  • 3.3.3 数据源包装器
  • 3.4 公共数据模型设计
  • 3.4.1 设计原则
  • 3.4.2 公共数据模型的建立
  • 3.5 元数据字典设计
  • 3.5.1 元数据
  • 3.5.2 全局数据字典
  • 3.5.3 局部数据字典
  • 3.6 本章小结
  • 第四章 请求处理与包装器实现
  • 4.1 请求处理
  • 4.2.1 查询解析
  • 4.2.2 查询分解
  • 4.2.3 数据组装
  • 4.2 包装器实现
  • 4.3.1 查询重写
  • 4.3.2 数据提取
  • 4.3.3 结果转换
  • 4.3 本章小结
  • 第五章 Web包装器自动生成器
  • 5.1 设计思想
  • 5.2 生成器框架结构
  • 5.3 关键技术研究
  • 5.3.1 定义抽取模式
  • 5.3.2 预处理页面文档
  • 5.3.3 生成抽取规则
  • 5.3.4 生成规则树
  • 5.4 评价与分析
  • 5.5 本章小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 工作展望
  • 致谢
  • 主要参考文献
  • 附录
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    异构数据集成技术研究
    下载Doc文档

    猜你喜欢