基于小生境遗传算法的增量贝叶斯算法

基于小生境遗传算法的增量贝叶斯算法

论文摘要

随着数字技术的飞速发展,数据量不断激增,导致海量数据的出现。然而这些浩繁的数据背后蕴藏着许多重要的信息,因此人们希望能够对其进行统计分析,以便更加方便地利用这些数据完成诸如天气预报、专家诊断等工作。数据分类由此应运而生。朴素贝叶斯算法是一种普遍应用的经典数据分类算法。该算法基于属性间独立性假设,即样本空间中元素之间的属性相互独立,以及贝叶斯后验概率定理。朴素贝叶斯算法的显著优点是相对于其它分类方法,朴素贝叶斯分类算法不需要搜索,只需简单地计算训练样本中各个属性值发生的概率,以此可以估计出每个属性的概率估计值,因而朴素贝叶斯分类算法的效率较高。但是,朴素贝叶斯算法同时也存在一些问题:其一,朴素贝叶斯算法不具有增量分类能力;其二,当大量样本需要分类时,计算比较复杂,没有充分利用分类信息;其三,该算法没有充分利用一次分类后遗留的分类信息。针对上述三方面问题,本文提出了一种基于小生境遗传算法的增量贝叶斯算法,同时引入向量空间概念,根据向量空间将样本量化,并应用小生境遗传算法在向量空间局部抽取出特征向量,作为不同类别的增量分类标准,进而简化了分类的计算量,提高了算法的分类精度。在使该算法具有增量分类能力的同时,在充分利用样本分类后产生的类别信息基础上降低了系统的时空开销。最后采用UCI数据集进行本算法的验证实验,实验表明基于小生境遗传算法的增量贝叶斯算法在一定程度上降低了时空复杂度并且具有了增量能力。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 论文的研究背景
  • 1.2 国内外研究现状
  • 1.3 课题的研究内容
  • 1.4 本文组织结构
  • 第2章 数据分类技术概述
  • 2.1 数据分类
  • 2.2 数据分类算法概述
  • 2.2.1 粗糙集分类
  • 2.2.2 ID3分类
  • 2.2.3 模糊分类
  • 2.2.4 关联分类
  • 2.2.5 改进的贝叶斯算法
  • 2.3 数据分类应用
  • 2.4 本章小结
  • 第3章 相关算法
  • 3.1 贝叶斯分类算法
  • 3.1.1 经典的朴素贝叶斯算法
  • 3.1.2 贝叶斯网算法
  • 3.1.3 贝叶斯算法的应用
  • 3.2 遗传算法
  • 3.2.1 基本遗传算法
  • 3.2.2 小生境遗传算法
  • 3.2.3 遗传算法的现状
  • 3.3 本章小结
  • 第4章 基于小生境遗传算法的增量贝叶斯算法
  • 4.1 问题描述
  • 4.2 增量贝叶斯算法
  • 4.2.1 相关概念
  • 4.2.2 小生境遗传算法在本算法中的应用
  • 4.2.3 增量分类
  • 4.2.4 改进的算法
  • 4.3 算法分析
  • 4.3.1 增量能力分析及优势
  • 4.3.2 时间复杂度和空间复杂度
  • 4.3.3 算法的适应性
  • 4.3.4 理想状态
  • 4.4 本章小结
  • 第5章 实验结果及分析
  • 5.1 实验数据集介绍
  • 5.2 实验环境介绍
  • 5.3 实验结果
  • 5.3.1 基于ABALONE数据集的实验
  • 5.3.2 基于NURSERY数据集的实验
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于小生境遗传算法的增量贝叶斯算法
    下载Doc文档

    猜你喜欢