主存数据库索引机制的研究与改进

主存数据库索引机制的研究与改进

论文摘要

随着主存速度和现代处理器的速度之间的差距逐渐扩大,系统对主存的存取访问成为新的瓶颈,Cache行为对主存数据库系统更加重要。高速缓冲存储器存(Cache)是在处理器与主存之间设置的静态随机访问存储器(SDRAM)。高速缓存装载系统运行时需要经常使用的数据,以减少处理器访问内存的次数,从而减少CPU等待时间。鉴于主存数据库本身的结构特点,Cache行为对主存数据库索引结构的设计显得更加重要。本文深入研究了高速缓存工作原理与Cache敏感(Cache-Conscious)技术,对现有的主存数据库索引结构进行了比较与分析。在CST-树的基础上提出一种改进的Cache敏感-T树—MCST-树(Improved Cache sensitive-Tree)索引结构。MCST-树的结构设计特点如下:(1)保留高频访问数据:构建了一个包含CST-树结点中最大关键字的折半查找树,使用这个折半查找树作为一个目录结构确定实际包含所要查找的关键字所在的结点。因为每次查找都会首先访问折半查找树,所以折半查找树中的内容被访问的频率很高。(2)指针的抽取:首先,将折半查找树保存在一个数组(结点组)中,不再保留指向父亲结点与孩子结点的指针。其次,结点组的孩子结点组连续存储,每个结点组仅保留一个指向其第一个孩子结点组的指针。(3)结点大小设计为Cache块大小:将存放折半查找树的数组设计为一个Cache块大小。结点组设计为一个Cache块大小时,在结点组内的访问不会发生Cache缺失。同时,本文还对应用预取技术时改进的Cache敏感型T-树结点组大小的设计进行分析,并且简单描述了应用预取技术时对改进的Cache敏感型T-树基本操作算法的关键部分的修改。实验结果表明,MCST-树索引结构在查找操作性能优势明显,同时MCST-树索引结构的空间代价最小。综合考虑空间代价与时间代价两个方面的因素,MCST-树的整体性能优于CSB+-树最好的一种变形——FULL CSB+-树。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 主存数据库系统概述
  • 1.1.1 主存数据库概念
  • 1.1.2 主存数据库技术
  • 1.1.3 主存数据库系统技术的发展
  • 1.2 主存与高速缓冲存储器对数据系统性能的影响
  • 1.3 主存数据库索引结构研究现状
  • 1.4 本文的研究内容
  • 1.5 文章的组织结构
  • 第二章 传统索引结构与高速缓冲存储器
  • 2.1 传统索引机制
  • 2.1.1 哈希索引机制
  • 2.1.2 平衡二叉树(AVL 树)索引机制
  • 2.1.3 T-树索引机制
  • 2.2 高速缓冲存储器
  • 2.2.1 高速缓存的工作原理
  • 2.2.2 计算机各级存储层次与访问次序
  • 2.3 本章小结
  • 第三章 Cache 敏感技术优化方法与索引结构设计
  • 3.1 Cache 敏感技术优化方法
  • 3.1.1 被动型Cache 敏感技术
  • 3.1.2 主动型Cache 敏感技术
  • 3.2 Cache 敏感型索引结构设计
  • 3.2.1 被动型Cache 敏感型索引结构
  • 3.2.2 主动型Cache 敏感型索引结构
  • 3.3 本章小结
  • 第四章 改进的高速缓存敏感T-树
  • 4.1 CST-树与MCST-树
  • 4.1.1 CST-树
  • 4.1.2 MCST-树
  • 4.2 MCST-树索引机制上的基本操作
  • 4.2.1 查找算法
  • 4.2.2 插入算法
  • 4.2.3 删除算法
  • 4.2.4 旋转算法
  • 4.2.5 时间复杂度分析
  • 4.3 应用预取技术的MCST-树
  • 4.3.1 创建加宽索引结点进行索引查找
  • 4.3.2 结点大小设计的定性分析
  • 4.3.3 应用预取技术时对MCST-树算法的修改
  • 4.4 本章小结
  • 第五章 性能测试与分析
  • 5.1 测试描述
  • 5.1.1 测试方法
  • 5.1.2 数据来源
  • 5.2 测试环境
  • 5.3 测试结果
  • 5.4 本章小结
  • 第六章 全文总结与展望
  • 6.1 全文总结
  • 6.2 研究展望
  • 参考文献
  • 致谢
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  

    主存数据库索引机制的研究与改进
    下载Doc文档

    猜你喜欢