基于粗糙集理论的数据挖掘方法研究及应用

基于粗糙集理论的数据挖掘方法研究及应用

论文摘要

数据挖掘技术是机器学习、数据库和统计理论相结合的产物,具有较为广泛的应用前景。粗糙集理论是八十年代初由波兰数学家首先提出的一种刻画不确定性和不完整性知识的数学工具。该理论近年来日益受到广泛关注,已在人工智能与知识发现、模式识别与分类、专家系统、故障检测等方面得到了成功的应用。本文在粗糙集数据挖掘方法理论上和应用上进行了研究。本文系统分析归纳了数据挖掘技术和基于粗糙集理论的数据挖掘方法。对数据挖掘从知识的角度进行了分类。对粗糙集理论的基本概念与性质,以及属性约简和属性值约简算法做了系统归纳。数据挖掘阶段采用的主要属性约简方法有三个:标准的数据分析属性约简、基于属性频率的属性约简和基于区分矩阵的约简。随着数据的不断增长,增量挖掘就成为人们所研究的主要方向之一。粗糙集增量数据挖掘采用动态约简方法得以解决。本文提出了粗糙集增量属性约简的算法,理论分析具有可行性。避免了|U|×|U|阶的区分矩阵运算,扩展了粗糙集的应用范围。规则抽取是数据挖掘的核心。本文研究了基于属性频率的启发式属性约简算法,此算法提高了挖掘速度,实现了规则的自动抽取。基于粗糙集的数据推理依赖于规则的表现形式。数据挖掘是一种由条件属性到决策系统规则的抽取,形如R→D的形式。本文根据粗糙集的规则推理的概念,在相容决策系统中提出了面向决策属性的信息融合的方法。主要内容为:1.针对不一致决策信息系统,构造了一种新的区分函数。用概率分布函数描述条件属性对决策系统的影响程度,从而获得最大分布集。2.针对常规算法的局限性,改进了基于区分矩阵和属性重要性的约简算法。3.针对属性频率的重要性,改进了基于属性频率的启发式属性约简算法。4.针对增量数据挖掘,提出了以动态约简为框架的增量属性约简方法。5.针对基于粗糙集的规则推理,提出了一种面向决策属性的信息融合的方法。6.设计并实现了一个基于粗糙集理论的数据挖掘系统。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 数据挖掘发展概述
  • 1.2 数据挖掘分类
  • 1.2.1 广义知识
  • 1.2.2 关联知识
  • 1.2.3 聚类知识
  • 1.2.4 分类知识
  • 1.2.5 偏差型知识
  • 1.2.6 预测型知识
  • 1.3 数据挖掘技术
  • 1.3.1 面向属性的归纳方法
  • 1.3.2 决策树分析
  • 1.3.3 基于范例学习
  • 1.3.4 遗传算法
  • 1.3.5 关联分析
  • 1.3.6 聚类分析
  • 1.3.7 Bayes 方法
  • 1.3.8 SVM 方法
  • 1.3.9 粗糙集理论
  • 1.3.10 HMM 方法
  • 1.3.11 神经网络技术
  • 1.4 本文的主要工作
  • 1.5 本文的组织结构
  • 第二章 粗糙集理论
  • 2.1 粗糙集理论研究进展
  • 2.2 粗糙集基本概念
  • 2.2.1 信息系统
  • 2.2.2 近似空间
  • 2.2.3 约简与核
  • 2.2.4 决策规则
  • 2.3 粗糙集基本算法
  • 2.3.1 属性约简
  • 2.3.1.1 区分矩阵
  • 2.3.1.2 约简算法
  • 2.3.2 属性值约简
  • 2.4 粗糙集的应用
  • 2.5 基于粗糙集的数据挖掘方法
  • 2.6 小结
  • 第三章 基于矩阵和信息熵的属性约简
  • 3.1 信息系统的约简与信息熵
  • 3.2 Pawlak 约简与一般决策约简的关系
  • 3.3 约简的三种区分函数
  • 3.4 基于特征矩阵的决策表约简
  • 3.5 小结
  • 第四章 属性约简算法的研究
  • 4.1 粗糙集的基本约简算法
  • 4.1.1 属性约简
  • 4.1.2 相关概念的时间复杂度分析
  • 4.1.3 基本算法
  • 4.2 区分矩阵的约简算法
  • 4.2.1 改进的区分矩阵算法
  • 4.2.2 实例分析
  • 4.3 属性频率函数的启发式约简算法
  • 4.3.1 启发式算法与区分矩阵的关系
  • 4.3.2 算法描述
  • 4.3.3 算法的研究和缺陷分析
  • 4.4 属性频率启发式算法的改进
  • 4.4.1 改进的属性频率启发式算法
  • 4.4.2 属性频率函数启发式的增量算法
  • 4.5 小结
  • 第五章 增量粗糙集属性约简
  • 5.1 粗糙集的增量挖掘概述
  • 5.1.1 属性变化
  • 5.1.2 实例增加
  • 5.2 动态约简
  • 5.2.1 动态约简概念
  • 5.2.1.1 动态约简特征
  • 5.2.1.2 动态约简模型
  • 5.2.1.3 约简域
  • 5.2.2 子集抽取
  • 5.2.2.1 簇F 大小确定
  • 5.2.2.2 子集样本空间确定
  • 5.2.3 动态约简过程
  • 5.2.4 动态约简启示
  • 5.3 增量数据挖掘
  • 5.3.1 设计思想
  • 5.3.2 算法描述
  • 5.4 小结
  • 第六章 面向决策系统的属性约简及推理
  • 6.1 基于粗糙集的数据推理
  • 6.1.1 概率逻辑
  • 6.1.2 概率规则
  • 6.1.3 决策规则及决策算法
  • 6.2 不相容决策信息系统的约简
  • 6.3 相容决策系统上的规则融合
  • 6.4 小结
  • 第七章 粗糙集数据挖掘系统的分析与实现
  • 7.1 数据挖掘分析
  • 7.2 软件的设计与实现
  • 7.2.1 功能分析
  • 7.2.2 约简过程
  • 7.3 小结
  • 第八章 结论和展望
  • 8.1 本论文研究总结
  • 8.2 前景展望
  • 致谢
  • 参考文献
  • 攻硕期间取得的成果
  • 相关论文文献

    • [1].基于软区分矩阵的模糊软集决策方法及其应用[J]. 计算机工程与应用 2016(24)
    • [2].维度增量决策表的区分矩阵属性约简方法[J]. 小型微型计算机系统 2017(02)
    • [3].基于二进制区分矩阵的离散化算法[J]. 计算机工程与应用 2014(21)
    • [4].基于互信息的二进制区分矩阵特征约简方法[J]. 西南师范大学学报(自然科学版) 2015(08)
    • [5].不完备软区分矩阵及其在决策问题中的应用[J]. 计算机工程与科学 2015(08)
    • [6].基于二进制区分矩阵的属性约简方法及应用[J]. 自动化与仪器仪表 2013(06)
    • [7].一种基于反区分矩阵的多维关联规则挖掘方法[J]. 广西民族大学学报(自然科学版) 2013(01)
    • [8].改进的优势区分矩阵及其求核方法[J]. 计算机工程与应用 2010(27)
    • [9].基于优势区分矩阵的求核方法[J]. 计算机工程 2008(16)
    • [10].基于布尔区分矩阵与关联规则挖掘的属性约简算法[J]. 计算机应用与软件 2012(10)
    • [11].基于模糊区分矩阵的结直肠癌基因选择[J]. 南京大学学报(自然科学) 2019(04)
    • [12].一种基于二进制区分矩阵的属性约简算法[J]. 信息与控制 2009(01)
    • [13].一种改进的可区分矩阵与求核方法[J]. 计算机工程与科学 2009(02)
    • [14].基于二进制区分矩阵的增量式属性约简算法[J]. 计算机工程 2017(01)
    • [15].基于区分矩阵的妇科方剂配伍规律研究[J]. 时珍国医国药 2018(11)
    • [16].基于二进制区分矩阵的不完备系统增量式属性约简算法[J]. 计算机科学 2017(07)
    • [17].基于柔性逻辑的区分矩阵属性约简算法[J]. 计算机系统应用 2018(03)
    • [18].基于区分矩阵的数据离散化算法[J]. 计算机工程与应用 2008(35)
    • [19].条件属性递增系统的核属性动态更新算法[J]. 计算机工程与应用 2012(07)
    • [20].基于属性集划分对象空间能力的约简[J]. 重庆三峡学院学报 2009(03)
    • [21].基于改进区分矩阵的决策表增量式属性约简[J]. 计算机工程 2010(20)
    • [22].基于区分矩阵的属性约简算法的作物病害识别方法[J]. 江苏农业科学 2015(01)
    • [23].基于粗糙集理论构建心理疾病简单自诊系统[J]. 佳木斯教育学院学报 2011(06)
    • [24].一种改进的模糊粗糙集属性约简启发式算法[J]. 漳州师范学院学报(自然科学版) 2008(01)
    • [25].基于优势关系区别矩阵的一种增量求核方法[J]. 计算机应用研究 2008(07)
    • [26].广义不完备信息系统的知识约简[J]. 计算机应用研究 2009(08)
    • [27].基于HORAFA算法的改进增量数据挖掘算法[J]. 四川师范大学学报(自然科学版) 2009(05)
    • [28].决策系统中几种约简之间的关系[J]. 计算机科学 2018(S2)
    • [29].一种基于变精度粗糙集的图像分类方法[J]. 沈阳化工学院学报 2009(02)
    • [30].一种基于粗糙集的属性值约简方法[J]. 计算机应用与软件 2010(08)

    标签:;  ;  ;  ;  

    基于粗糙集理论的数据挖掘方法研究及应用
    下载Doc文档

    猜你喜欢