数据挖掘在入侵检测中的应用

论文摘要

随着计算机网络的快速发展，人们在享受网络带来的便利的同时，对网络安全的要求也越来越高，传统的安全技术无法满足人们日益增长的网络安全的需求，入侵检测是继防火墙之后的一项新的安全技术，随着网络技术和相关学科的发展而成熟，成为了网络安全的一道新防线。入侵检测技术的关键就是从海量的数据当中区分正常行为和攻击行为，但是现有的入侵检测系统有着较高的误报率，成为了入侵检测技术进一步发展的瓶颈。数据挖掘技术可以从海量的数据当中找到人们感兴趣的知识，因此可以把入侵检测的过程看成是一个数据挖掘的过程。同时，入侵行为对应的数据与正常行为对应的数据具有不同的特征，数据挖掘技术通过寻找数据内部之间的关系，从而能够很好的区分这两种行为，达到提高检测率、降低误报率的目的。本文从入侵检测的发展历史和研究现状出发，介绍了入侵检测技术及其通用的体系结构，为基于数据挖掘的入侵检测模型的设计提供了相关可操作性理论依据；阐述了经典的数据挖掘方法，着重介绍了聚类分析的方法、划分聚类的度量方法和原始的K-means算法。原始的K-means算法对初始聚类中心敏感，本文利用遗传算法对聚类中心进行优化，对每个聚类中心进行染色体编码，并对其进行交叉、变异操作得到新的聚类中心，使用K-means算法快速收敛获取聚类结果，选择适应度高的聚类中心遗传下去，如此反复迭代，直到准则函数收敛，解决了原始K-means算法容易陷入局部最优的问题。原始的K-means算法对输入数据的顺序有很强的依赖性，本文利用统计学的方法，对每个聚类中记录的类型进行个数统计，选择一定比例的记录作为孤立点，将这些孤立点从原有聚类中剔除，并对它们进行重新的聚类划分。本文模拟了入侵检测的过程设计了一个简单的模型，该模型包括网络数据的收集、特征的选择、数据的标准化、入侵检测以及告警响应，并对各部分进行了详细叙述。在入侵检测的经典数据集KDD CUP1999上检验了算法的有效性。实验结果表明，该方法与相关研究对比提高了入侵检测系统的精度和效率。

论文目录

摘要

Abstract

插图索引

附表索引

第1章绪论

1.1 研究背景

1.2 研究现状

1.3 论文的研究范围、主要内容

1.4 论文的基本结构

第2章聚类分析

2.1 数据挖掘的定义

2.2 数据挖掘的方法

2.3 聚类分析技术

2.3.1 聚类的概念和过程

2.3.2 聚类分析的方法

2.3.3 聚类度量

2.3.4 聚类准则函数

2.4 本章小结

第3章入侵检测技术

3.1 入侵的定义和入侵行为

3.2 入侵检测的定义

3.3 入侵检测系统

3.3.1 入侵检测体系结构分类

3.3.2 入侵检测主要研究技术

3.4 入侵检测工具

3.5 入侵检测存在的问题

3.6 入侵检测的发展趋势

3.7 本章小结

第4章改进的 K-means 算法

4.1 原始的 K-means 算法

4.1.1 原始的 K-means 的主要思想

4.1.2 原始的 K-means 算法的形式化描述

4.2 改进的 K-means 算法

4.2.1 聚类中心的优化

4.2.2 孤立点处理

4.3 本章小结

第5章改进的 K-means 算法在入侵检测中应用

5.1 基于改进的 K-means 算法的入侵检测模型

5.2 数据预处理

5.2.1 KDD Cup1999 数据集的介绍

5.2.2 特征属性的选择

5.2.3 数据的标准化

5.3 实验结果

5.4 本章小结

结论

参考文献

附录 A 攻读硕士学位期间已经录用的论文

致谢

数据挖掘在入侵检测中的应用

论文摘要

论文目录

相关论文文献

猜你喜欢