可拓数据挖掘利用可拓学理论和方法挖掘企业数据库中的潜在有用知识,为企业竞争、生产决策和解决矛盾问题提供帮助。目前,可拓分类知识挖掘是可拓数据挖掘的主要研究内容。传统的可拓分类知识挖掘使用的综合关联函数的权值需要由相关领域的专家给出,具有一定的主观性和不确定性;同时,该领域中可拓集合和可拓变换相关内容还处于概念阶段,缺乏具体的操作方法。针对上述不足,本文采用了基于区间的方法来挖掘可拓分类知识,主要工作如下:1、提出了基于值域覆盖确定关联函数权值的方法。该方法根据关联函数的原理,以不同类别的属性取值范围的覆盖程度作为获得权值的依据,从数据本身入手,寻找能够得到最佳分类效果的属性权重。2、提出了基于区间映射的可拓变换方法,为可拓变换提供一条具体的实施办法,同时将可拓变换的作用域从全体论域缩小到某一类别的数据,进而改进可拓集合的表示。3、将传统的可拓集合只针对二元分类的情况进行了改进。当数据样本为多元分类的情况时,为可拓变换作用的类别与其他所有类别之间建立质变域和量变域。进而对多元分类数据的可拓集合进行了演示。经过UCI数据验证,改进的关联函数方法不仅在准确率上优于其他经典分类算法,在运算速度上同样占有优势。而本文提出的可拓变换以及改变后的可拓集合也能够为决策者提供决策方案。
本文来源: https://www.lw50.cn/article/21d0d54625361e83bd93e791.html