基于关系数据库的XML查询优化技术研究

基于关系数据库的XML查询优化技术研究

论文摘要

XML是W3C于1998年提出的一种标记语言,由于独特的技术优势,XML推出后很快就成为Internet上信息描述和交换的标准。随着XML应用的越来越广泛,Web上的XML文档与日俱增,为了实现对海量XML数据的高效存储与访问,基于数据库技术的XML查询优化已成为一个十分重要的研究课题。论文首先分析了XML数据库的发展现状,接着介绍了XML Schema等XML的相关概念;为了有效地支持XML查询优化,对XML数据的几种编码方法和关系存储模型以及查询优化的几种方式做了一些探究。本文主要是对基于关系数据库的XML查询优化技术进行研究,所做的主要工作包括:(1)基于区间编码和XRel关系存储模型的基础上,提出了扩展的关系存储模型,该模型可以高效地实现结构连接中包含关系与位置关系的计算。(2)提出了一种基于XML模式信息的路径表达式的优化方法,其实现步骤包括:模式信息的提取、判断结点是否可优化以及优化算法描述,当路径表达式较长时,这种方法能够很好的减少路径表达式的连接操作次数,从而实现路径的优化。(3)由于XML文档的查询通常被转化为两个结点之间的包含关系或文档位置关系的计算,因此有效地支持结构连接对XML查询的实现意义重大。文章对结构连接算法进行了研究和改进,基于扩展的关系存储模型实现了更为有效地包含关系的结构连接算法。改进的算法能够避免对内表的重复扫描,在对双亲/孩子关系的结构连接操作时,CPU时间和I/O复杂度比原算法要低得多,特别是当双亲结点的队列中存在嵌套结点时,改进后的算法更优越。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 XML数据库系统的现状
  • 1.3 本文主要研究内容
  • 1.4 论文的组织结构
  • 第2章 XML及其查询语言
  • 2.1 XML概述
  • 2.2 与XML有关的基本概念
  • 2.2.1 XML DTD
  • 2.2.2 XML Schema
  • 2.2.3 DOM与SAX
  • 2.3 XML查询语言
  • 2.3.1 LOREL查询语言
  • 2.3.2 XML-QL查询语言
  • 2.3.3 XPath查询语言
  • 2.3.4 XQuery查询语言
  • 2.4 本章小结
  • 第3章 对XML编码及关系存储的研究
  • 3.1 XML编码
  • 3.1.1 区间编码
  • 3.1.2 前缀编码
  • 3.1.3 k分树编码
  • 3.1.4 支持动态更新的编码
  • 3.2 XML数据的关系存储
  • 3.2.1 模型映射方法
  • 3.2.2 存储粒度问题
  • 3.3 本章小结
  • 第4章 XML查询优化
  • 4.1 XML查询优化与关系数据库查询优化的关系
  • 4.2 XML查询优化的方式
  • 4.2.1 编码机制
  • 4.2.2 路径优化
  • 4.2.3 索引优化
  • 4.3 基于模式的路径表达式优化
  • 4.3.1 模式信息提取
  • 4.3.2 路径表达式的优化
  • 4.4 本章小结
  • 第5章 结构连接算法的研究与改进
  • 5.1 研究现状
  • 5.2 对存储模型的改进
  • 5.3 对包含关系的结构连接算法的改进
  • 5.3.1 一种处理包含关系结构连接的算法
  • 5.3.2 改进的包含关系结构连接的算法
  • 5.4 算法分析
  • 5.5 本章小结
  • 第6章 总结与展望
  • 6.1 论文总结
  • 6.2 未来工作
  • 致谢
  • 参考文献
  • 攻读硕士期间发表的论文和参加的项目
  • 相关论文文献

    标签:;  ;  ;  

    基于关系数据库的XML查询优化技术研究
    下载Doc文档

    猜你喜欢