多关系关联规则挖掘研究

多关系关联规则挖掘研究

论文摘要

多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。对于多关系的数据挖掘研究,如何高效地挖掘以及如何提高算法的可扩展性,一直是大家研究的重点。与传统的数据挖掘算法相比,多关系数据挖掘特有的复杂性对算法的性能提出了更高的要求。多关系数据挖掘算法的搜索空间变得更大、更复杂。目前多关系数据挖掘主要集中在两个方面进行研究,其一是基于ILP理论的技术,是以逻辑原子的方式表达项集,通过Prolog查询来计算项集的支持度,借鉴典型的单表关联规则挖掘算法,通过分层迭代的方法发现存在于多表的关联规则。这种方法在实现挖掘多表关联规则的同时可以避免统计偏斜问题的发生,另一种方法是基于非ILP技术的多关系关联规则挖掘算法,这种方法主要致力于挖掘解决算法存在的性能问题。针对以上问题,本文主要做了以下工作:首先,本文对数据挖掘理论、数据挖掘中关联规则算法进行了总结,重点研究了多关系数据挖掘中的关联规则算法。介绍了目前主流的多关系挖掘技术,基于ILP技术的多关系关联规则挖掘的经典算法以及非ILP技术中解决多关系表连接问题的元组ID传播理论。其次,本文将FP-Growth算法引入到多关系挖掘中,提出了多关系FP-Growth算法,详细给出了多关系挖掘中如何构建FP树以及如何寻找树中的频繁项集,并用一个具体的示例展示了算法。最后对于基于非ILP技术算法存在的统计偏斜问题提出了进一步优化。最后,本文通过PKDD会议给出的数据集,对算法进行了实验验证并与其他算法进行了对比,并对实验结果进行了分析。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 研究背景
  • 1.3 国内外研究现状
  • 1.4 内容组织
  • 第二章 数据挖掘及关联规则
  • 2.1 数据挖掘概述
  • 2.2 数据挖掘的模式及一般过程
  • 2.2.1 数据挖掘的模式
  • 2.2.2 数据挖掘的一般过程
  • 2.3 关联规则挖掘的基本概念及算法
  • 2.3.1 关联规则挖掘基本概念及分类
  • 2.3.2 关联规则挖掘算法
  • 2.4 本章小结
  • 第三章 多关系关联规则挖掘
  • 3.1 基于ILP技术的多关系挖掘算法
  • 3.1.1 算法WARMR
  • 3.1.2 算法FARMER
  • 3.2 非ILP技术的多关系关联规则挖掘
  • 3.2.1 JSApriori算法
  • 3.2.2 元组ID传播原理
  • 3.3 本章小结
  • 第四章 挖掘多关系频繁项集
  • 4.1 多关系FP树的构建
  • 4.1.1 多关系FP树的一些基本定义
  • 4.1.2 多关系FP树的构建
  • 4.2 多关系频繁模式树的挖掘
  • 4.3 本章小结
  • 第五章 实例分析
  • 5.1 简单示例
  • 5.2 对统计偏斜问题的优化策略
  • 5.3 本章小结
  • 第六章 实验及结果分析
  • 第七章 总结与展望
  • 参考文献
  • 附录A 图索引
  • 附录B 表索引
  • Appendix A. Figure Index
  • Appendix B. Table Index
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  

    多关系关联规则挖掘研究
    下载Doc文档

    猜你喜欢