
论文摘要
时态数据库是对传统关系型数据库的扩展,因此时态数据库对时态聚集查询的支持是非常重要的。由于时态聚集查询在数据仓库应用中的重要性,时态聚集查询已经成为时态数据库技术中的研究热点之一。现有的时态聚集算法存在着查询内存空间需要较大、处理开销较高、基于复杂的数据结构(不能适用于现有的商业产品中)等缺点。基于这些缺点,本文提出了两种基于有限误差近似技术的改进算法。第一种是基于多版本B树的改进算法,针对查询内存空间占用大和时间开销大的缺点,由于引入了近似技术,该算法的空间开销大大减少,因此在最坏情况下的查询开销为对数级,但该算法并没有解决基于复杂的数据结构,因此并不适合在商业产品中实现;第二种算法采用B-树和R-树相结合的算法,针对现有算法查询内存空间需要较大、处理开销较高、特别是基于复杂的数据结构的缺点,采用现代广泛应用于商业产品中的数据结构B-树和R-树,并结合近似技术来解决这个问题。该算法查询开销也可以达到对数级,因此在现代商业产品中实现的可能性大大提升。本文对于以上两种算法的结果,分别进行了理论证明和实验证明,结果表明这两种算法的确在空间开销上有了数量级上的优化,并且其时间复杂度达在很大程度上得到了提高。以往用户对于历史数据的检索都是基于精确查询的,但是事实上并不需要那么精确,有时仅仅是想了解一个趋势,因此近似技术的应用使用户能够高效的查询历史数据,了解趋势的发展,以便制定发展方向。
论文目录
摘要Abstract第1章 绪论1.1 引言1.2 国内外时态数据库研究及时态聚集算法的现状与发展1.3 课题的意义目的和作者工作内容1.4 论文的组织第2章 时态数据库概述2.1 时态数据库术语2.2 时态数据库的特点2.3 时态数据模型2.3.1 历史关系数据库模型2.3.2 对象历史模型2.3.3 TempSQL模型2.3.4 双时态数据模型2.4 时态数据库的重要意义2.5 本章小结第3章 时态聚集技术3.1 时态聚集查询的术语3.1.1 元组排除3.1.2 元组分组3.1.3 分组排除3.1.4 重复消除3.1.5 聚集变量3.1.6 聚集函数位置3.1.7 时态分组3.2 多版本B树3.3 聚集处理技术3.4 强制最近邻查询3.5 本章小结第4章 近似技术在时态计数及求和聚集中的应用4.1 近似问题的提出和查询的简化4.2 一种基于MVB树近似求解LKST计数查询的算法4.3 一种基于B-树和R-树近似求解LKST计数查询的算法4.4 近似时态求和处理4.5 近似时态聚集算法的总结及性能分析4.6 本章小结第5章 实验分析5.1 空间比较5.2 MVB树近似求解LKST计数查询的算法分析5.3 基于B-树和R-树近似求解LKST计数查询算法分析5.4 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:时态数据库论文; 时态聚集论文;