稀有数据的集成特征选择与入侵检测

稀有数据的集成特征选择与入侵检测

论文摘要

网络安全技术一直是人们研究的热点。作为网络安全体系中不可或缺的重要部分,入侵检测系统有着广泛的应用。它能够实时监控网络状况,及时报警入侵活动,有效弥补防火墙的不足。目前,已有许多研究人员对入侵检测进行深入研究,提出了一些有效的检测算法。然而随着互联网的高速发展,网络数据规模越来越大、越来越复杂。入侵活动隐藏在这些海量的网络数据流中,难以发现。此外,与正常网络通信的数据量相比,入侵活动的数据量很小。传统的入侵检测技术以整体检测准确率作为检测标准,容易忽略数据量较小的入侵活动,已经不适合网络新环境。另一方面,现有检测方法大部分是有监督算法,对无监督算法的研究较少。这些检测算法需要考虑样本的类标签,对于海量的网络数据集来说,这大大增加了入侵检测系统的成本,降低了系统的运行效率。因此,必须发展新的方法来检测这些入侵行为。针对这些问题,本文提出两种解决途径,集成特征选择和改进重抽样。在不平衡问题中,特征选择的难点在于难以确定有效区别少数类样本和多数类样本的特征。本文综合了集成技术和无监督特征选择方法,提出了集成特征选择方法。实验表明,该方法能够选择出对区分样本类别贡献较大的特征,并且能保持较高的入侵检测效率。为了提高入侵检测中样本数极少类别的检测效率,在无监督聚类和抽样的基础上,提出一种无监督的基于抽样的支持向量聚类算法(SVCR).该方法将支持向量聚类和重抽样相结合,通过对多数类样本进行欠抽样,对少数类样本过抽样,合理选择参与学习的样本。在相关入侵检测数据集上进行了实验,结果表明,本文提出的方法对数量极少的样本的检测效率有较大幅度的提高。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 入侵检测研究现状
  • 1.3 本文主要研究内容及结构安排
  • 第二章 不平衡数据集的学习算法
  • 2.1 数据层面算法
  • 2.2 算法层面算法
  • 第三章 无监督集成特征选择
  • 3.1 引言
  • 3.2 无监督特征选择度量
  • 3.3 不平衡入侵检测数据集的集成特征选择
  • 3.4 实验结果与分析
  • 3.5 本章小结
  • 第四章 不平衡入侵检测数据的检测模型
  • 4.1 支持向量聚类基础
  • 4.1.1 参数选择
  • 4.1.2 停止条件
  • 4.2 基于SVC和重抽样的入侵检测模型
  • 4.2.1 重抽样方法
  • 4.2.2 算法流程
  • 4.2.3 实验与分析
  • 4.3 本章小结
  • 第五章 总结与展望
  • 参考文献
  • 致谢
  • 个人简介、在学期间的研究成果及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    稀有数据的集成特征选择与入侵检测
    下载Doc文档

    猜你喜欢