面向数据挖掘的分类器集成研究

面向数据挖掘的分类器集成研究

论文摘要

分类是数据挖掘的一项主要任务。分类器设计是决定分类性能的关键因素之一。近年来,分类器集成学习由于其在降低分类系统泛化误差、简化分类器设计等方面的优良表现,成为人工智能、机器学习、模式识别、神经计算等领域的研究人员以及各工程应用领域中的技术人员共同关心的一个研究热点。本文在全面介绍分类器集成的研究现状、工作机理和发展趋势的基础上,提出了用于提高分类器集成系统分类性能、扩大其应用范围的多种算法。包括:(1)在分析了集成的整体性能与成员分类器性能和多样性之间关系的基础上,提出了一种基于聚类的分类器选择集成算法。该算法以多样性作为聚类距离,以准确性作为选择标准,能够显著提高原系统的多样性及分类性能。(2)利用分布估计算法对特征集进行优化选择建立分类器集成。经过优化选择不仅降低了集成规模,而且提高了集成的整体性能。(3)研究了如何利用集成方法进行缺失数据的分类。提出了一种利用分类器集成进行缺失数据分类的算法。该算法对数据缺失机制不作任何假定,而且可以处理测试样本中新的缺失模式。(4)研究了如何利用集成进行自适应的分类系统增量学习。提出了一种基于两级假设检验的学习方法。既避免了对旧知识的“灾难性遗忘”,又增强了学习的“稳定性”。

论文目录

  • 提要
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外研究进展概述
  • 1.2.1 实现方法研究
  • 1.2.2 理论研究
  • 1.2.3 应用研究
  • 1.3 分类器集成的基本概念
  • 1.3.1 系统组成结构
  • 1.3.2 成员分类器的结果表达方式
  • 1.3.3 分类结果组合方法
  • 1.4 分类器集成研究存在的问题
  • 1.5 论文主要研究内容
  • 1.6 论文总体结构
  • 第二章 基于聚类的分类器集成学习
  • 2.1 集成的性能与多样性
  • 2.2 分类器性能和多样性度量方法
  • 2.2.1 分类器的性能度量
  • 2.2.2 多样性的度量
  • 2.3 基于聚类的分类器集成方法
  • 2.3.1 成员分类器的生成方法
  • 2.3.2 聚类选择
  • 2.3.3 结论组合
  • 2.4 实验及分析
  • 2.5 小结
  • 第三章 基于特征集优化选择的分类器集成学习
  • 3.1 特征选择
  • 3.1.1 分类器学习中的Hughes现象
  • 3.1.2 特征选择与提取
  • 3.2 基于特征选择的分类器集成方法
  • 3.3 EDA优化算法
  • 3.3.1 遗传算法及其存在的问题
  • 3.3.2 EDAs算法的演化及分类
  • 3.4 基于特征集优化选择的分类器集成方法
  • 3.4.1 候选特征集合的生成
  • 3.4.2 种群描述及适应度度量
  • 3.4.3 BN概率模型
  • 3.4.4 新个体的生成
  • 3.5 实验
  • 3.6 小结
  • 第四章 面向缺失数据的分类器集成学习
  • 4.1 缺失数据集处理的研究状况
  • 4.2 数据缺失机制与原因
  • 4.3 缺失数据处理方法
  • 4.3.1 删除法
  • 4.3.2 参数估计法
  • 4.3.3 单值插补法
  • 4.3.4 多值插补法
  • 4.4 面向缺失数据的分类器集成方法
  • 4.4.1 缺失模式学习
  • 4.4.2 构建分类器
  • 4.4.3 分类测试
  • 4.5 实验分析及讨论
  • 4.5.1 数据集
  • 4.5.2 性能比较与讨论
  • 4.6 小结
  • 第五章 基于集成的分类器增量学习
  • 5.1 增量学习及概念飘移现象
  • 5.1.1 增量学习的意义及方法
  • 5.1.2 概念飘移
  • 5.2 朴素Bayes分类器增量学习
  • 5.2.1 参数估计的递归贝叶斯方法
  • 5.2.2 基于递归贝叶斯方法的朴素Bayes分类器增量学习
  • 5.3 基于集成的朴素Bayes分类器增量学习
  • 5.3.1 基于假设检验的概念飘移检测
  • 5.3.2 分类系统的更新
  • 5.3.3 对新样本的分类
  • 5.3.4 参数分析
  • 5.4 实验
  • 5.4.1 数据集
  • 5.4.2 性能比较
  • 5.4.3 讨论
  • 5.5 小结
  • 第六章 结论
  • 参考文献
  • 攻读博士学位期间的研究成果
  • 致谢
  • 摘要
  • Abstract
  • 相关论文文献

    • [1].基于动态分类器集成系统的卷烟感官质量预测方法[J]. 计算机应用与软件 2020(01)
    • [2].基于标准数据集的分类器融合学习模型[J]. 微型电脑应用 2020(04)
    • [3].一种自适应子融合集成多分类器方法[J]. 计算机测量与控制 2019(04)
    • [4].基于多分类器融合的近红外光谱技术鉴别蜂蜜品种[J]. 化学分析计量 2019(03)
    • [5].基于分类器的身份证号码识别研究[J]. 贵州科学 2018(01)
    • [6].一种基于多分类器融合的人体运动行为识别模型[J]. 计算机科学 2016(12)
    • [7].一种基于混淆矩阵的分类器选择方法[J]. 河南理工大学学报(自然科学版) 2017(02)
    • [8].一种代价敏感的三类分类器评估方法的研究与应用[J]. 通化师范学院学报 2017(08)
    • [9].基于多分类器组合的遥感土地利用分类研究[J]. 安徽农业科学 2015(32)
    • [10].多分类器融合与单分类器影像分类比较研究[J]. 矿山测量 2016(04)
    • [11].《未来垃圾分类器》[J]. 幼儿教育 2020(14)
    • [12].基于多分类器组合的城市不透水面提取研究[J]. 城市地理 2017(04)
    • [13].《垃圾分类器》[J]. 辅导员 2016(11)
    • [14].基于一种新的级联分类器的目标检测系统[J]. 现代电子技术 2020(01)
    • [15].最佳的分类器链局部检测与挖掘算法[J]. 计算机工程与设计 2017(11)
    • [16].基于多分类器融合与模糊综合评判的滚动轴承故障诊断[J]. 中国科技论文 2016(04)
    • [17].近红外光谱和多分类器融合的葡萄酒品种判别研究[J]. 光谱学与光谱分析 2016(11)
    • [18].基于多分类器集成的语音情感识别[J]. 微电子学与计算机 2015(07)
    • [19].基于集成分类器的流量识别技术研究[J]. 科技视界 2015(33)
    • [20].二叉树型多分类器融合的轴承故障诊断方法[J]. 计算机工程与应用 2015(21)
    • [21].智能垃圾分类器[J]. 科学启蒙 2013(12)
    • [22].一种新的多分类器融合方法[J]. 西南师范大学学报(自然科学版) 2014(01)
    • [23].动态加权投票的多分类器聚合[J]. 现代计算机(专业版) 2014(05)
    • [24].面向用户观点分析的多分类器集成和优化技术[J]. 计算机学报 2013(08)
    • [25].基于证据理论的优化集成分类器融合算法及应用[J]. 化工学报 2012(09)
    • [26].多类不平衡数据上的分类器性能比较研究[J]. 计算机工程 2011(10)
    • [27].基于多分类器融合的语音识别方法研究[J]. 重庆邮电大学学报(自然科学版) 2011(04)
    • [28].基于粗糙集约简的多分类器系统构造方法[J]. 计算机工程与应用 2010(03)
    • [29].面向对象森林分类的多分类器结合方法研究[J]. 南京林业大学学报(自然科学版) 2010(01)
    • [30].选择分类器进行入侵检测[J]. 微计算机信息 2010(06)

    标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

    面向数据挖掘的分类器集成研究
    下载Doc文档

    猜你喜欢