基于SVM的P2P数据流检测技术的研究

基于SVM的P2P数据流检测技术的研究

论文摘要

P2P(Peer to Peer)技术在Internet中占有举足轻重的地位,近年来迅速成为计算机网络界关注的焦点;但是P2P技术发展的同时带来了网络带宽的大量占用、知识产权纠纷、安全威胁等问题。为了促进P2P网络健康发展,对P2P数据流进行有效的监管,准确识别P2P数据流显然已经成为P2P流管理中重要的研究课题。本文针对目前P2P数据流检测中存在的小数据流检测准确率不高、伪装的P2P数据流和新出现的P2P数据流学习能力低,识别效率不高的问题,设计实现了一个改进的基于SVM的P2P数据流识别技术,主要围绕以下几方面的问题进行了研究和讨论:(1)在数据包采样阶段应用SGS变频率数据包采样策略,相比于传统的固定频率数据包采样方法,能够实时地灵活控制数据包采样频率,根据现实网络情况更好地实现小数据流的采样,创建均衡的数据流量样本集;(2)设计构造了SVM训练样本集,根据正例反例样本的均衡性,样本代表性等原则,对不同的P2P网络应用和非P2P网络应用中200余个流量特征进行统计分析,权衡P2P样本训练的效率与分类器准确率,选取五个数据流特征作为样本特征;(3)首次训练采用训练样本集生成数据流分类器,之后将增量学习算法应用到SVM迭代训练当中,将分类错误的样本与已有的支持向量集组成新的训练样本,并且对新的训练样本进行分组训练以达到对样本学习规模、训练时间复杂度和迭代训练样本对SVM分类器灵敏度影响的控制。本文采用Andew Moore数据集和某网络服务器截获的数据流集作为测试样本,分别应用本文所实现的分类器对普通流量数据流、小流量数据流的检测精度、漏报率和误报率三个性能指标做了统计分析;并且与传统的SVM技术、BP神经网络技术、贝叶斯技术、决策树模型的数据流分类器的测试结果做了对比。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究背景与目的意义
  • 1.2 国内外研究现状
  • 1.3 论文的研究内容
  • 1.4 论文的组织结构
  • 第2章 P2P数据流识别相关理论与技术
  • 2.1 P2P流量检测技术概述
  • 2.1.1 基于端口检测技术
  • 2.1.2 基于深层数据包检测技术
  • 2.1.3 基于流量特征的检测技术
  • 2.2 SVM技术简介
  • 2.2.1 SVM的技术特点
  • 2.2.2 SVM的应用领域
  • 2.2.3 SVM理论分析
  • 2.2.4 LSVM理论分析
  • 2.3 SGS数据包采样算法简介
  • 2.4 基于LIBSVM函数库的SVM程序设计
  • 2.4.1 LIBSVM简介
  • 2.4.2 SVM训练过程
  • 2.4.3 SVM预测过程
  • 2.5 本章小结
  • 第3章 基于SVM的P2P数据流检测技术的研究
  • 3.1 检测工作流程
  • 3.1.1 SVM样本训练流程
  • 3.1.2 SVM预测程序流程
  • 3.2 SGS数据包采样策略
  • 3.3 SVM样本特征的选择
  • 3.4 SVM训练样本采集
  • 3.5 基于SVM的反馈增量学习算法
  • 3.6 SVM交叉验证法检测策略
  • 3.7 P2P数据流检测标准
  • 3.8 本章小结
  • 第4章 P2P数据流分类器性能评价与分析
  • 4.1 测试样本A实验结果
  • 4.2 测试样本B实验结果
  • 4.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于SVM的P2P数据流检测技术的研究
    下载Doc文档

    猜你喜欢