基于区间方法的可拓分类知识挖掘的研究

论文摘要

可拓数据挖掘利用可拓学理论和方法挖掘企业数据库中的潜在有用知识,为企业竞争、生产决策和解决矛盾问题提供帮助。目前,可拓分类知识挖掘是可拓数据挖掘的主要研究内容。传统的可拓分类知识挖掘使用的综合关联函数的权值需要由相关领域的专家给出,具有一定的主观性和不确定性；同时,该领域中可拓集合和可拓变换相关内容还处于概念阶段,缺乏具体的操作方法。针对上述不足,本文采用了基于区间的方法来挖掘可拓分类知识,主要工作如下：1、提出了基于值域覆盖确定关联函数权值的方法。该方法根据关联函数的原理,以不同类别的属性取值范围的覆盖程度作为获得权值的依据,从数据本身入手,寻找能够得到最佳分类效果的属性权重。2、提出了基于区间映射的可拓变换方法,为可拓变换提供一条具体的实施办法,同时将可拓变换的作用域从全体论域缩小到某一类别的数据,进而改进可拓集合的表示。3、将传统的可拓集合只针对二元分类的情况进行了改进。当数据样本为多元分类的情况时,为可拓变换作用的类别与其他所有类别之间建立质变域和量变域。进而对多元分类数据的可拓集合进行了演示。经过UCI数据验证,改进的关联函数方法不仅在准确率上优于其他经典分类算法,在运算速度上同样占有优势。而本文提出的可拓变换以及改变后的可拓集合也能够为决策者提供决策方案。

论文目录

摘要

ABSTRACT

第一章绪论

1.1 课题的研究背景

1.1.1 可拓数据挖掘的产生

1.1.2 可拓数据挖掘的概念

1.1.3 可拓数据挖掘的研究现状及发展趋势

1.2 课题的研究内容

1.3 论文组织结构

第二章背景知识

2.1 数据挖掘中的分类算法

2.1.1 决策树

2.1.2 简单贝叶斯分类

2.1.3 人工神经网络

2.2 可拓数据挖掘

2.2.1 挖掘可拓分类知识

2.2.2 挖掘传导知识

2.3 本章小结

第三章关联函数分类

3.1 数据预处理

3.1.1 去除离群点

3.1.2 物元描述

3.2 改进的综合关联函数分类方法

3.2.1 传统的关联函数分类方法

3.2.2 获取值域覆盖程度

3.2.3 获取权值

3.3 本章小结

第四章获取可拓知识

4.1 建立可拓变换

4.1.1 可拓变换的目的和意义

4.1.2 基于区间映射的可拓变换方法

4.2 建立可拓集合

4.2.1 传统的可拓集合

4.2.2 可拓变换的选择

4.2.3 质变域和量变域的描述

4.2.4 完整的可拓集合

4.3 可拓分类知识表示

4.4 本章小结

第五章 UCI数据集验证

5.1 UCI数据集介绍

5.2 改进的关联函数分类算法结果比较

5.3 UCI数据集的可拓分类知识表示

5.4 本章小结

第六章总结与展望

6.1 工作总结

6.2 工作展望

参考文献

致谢

研究成果及发表的学术论文

作者和导师简介

附件

基于区间方法的可拓分类知识挖掘的研究

论文摘要

论文目录

相关论文文献