基于LDAP的智能邮件头信息分析机制的设计与实现

基于LDAP的智能邮件头信息分析机制的设计与实现

论文摘要

随着Internet的发展,电子邮件以其经济快捷的特点,成为网络时代人们最基本最常用的信息交换手段之一。但电子邮件给用户带来便利的同时,也遭到了一些人的滥用,结果就是有大量的垃圾邮件充斥Internet。这些垃圾邮件不但影响了正常的网络应用,也影响了人们正常的工作和学习,给用户和网络服务提供商ISP(Internet Service Provider)造成了巨大的损失。因此,如何对垃圾邮件进行有效地过滤是当前网络应用研究中的一个重要方向。本文对垃圾邮件的主要过滤技术进行了总结和分析,发现近年来垃圾邮件的防治工作主要是依靠技术方式来实现,一种很有效的手段就是在邮件传输代理MTA(Mail Transfer Agent)处判断出垃圾邮件并进行过滤。电子邮件有很多特点,其中邮件结构是由邮件头和邮件主体组成的,而邮件头有很多信息可以被用作判断垃圾邮件的重要依据,并可以根据部分头信息追踪出垃圾邮件的源头,对垃圾邮件发送者给以治裁和处理。LDAP目录服务被设计为对读密集型操作进行优化,使用LDAP来存储信息会大大提高服务器的响应能力,所以本文选择OpenLdap数据库服务器。从邮件样本中提取邮件头信息将其存入数据库,利用向量空间模型生成邮件头信息向量,对这些向量进行分析。针对样本集规模、分类精度、发生类别增量时离线训练时间和敏感词汇等问题,文中分别设计了四种智能邮件头信息分析机制,分别基于可伸缩决策树算法、变精度粗糙集决策树算法、适应类别增量的决策树算法和一种新的快速BP神经网络算法(Back Propagation)。利用这四种算法对邮件头信息进行分析,提取特征,‘得到垃圾邮件过滤规则,这样就可以把分析得到的结果直接应用到MTA处,实现对垃圾邮件的阻挡。为了验证设计的四种邮件头信息分析机制的可行性和有效性,本文对这些机制进行了实现,并对以下几个方面的性能进行测试:获取规则的时间,发现垃圾邮件的能力,正确判断垃圾邮件的能力,将正常邮件误判为垃圾邮件的比例。在对四个机制分别测试后还进行了综合比较,从测试结果可以看到,这些机制在性能上取得了比较令人满意的结果,在过滤垃圾邮件的应用中是可行的和有效的。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 电子邮件
  • 1.1.1 电子邮件发展历史
  • 1.1.2 电子邮件格式
  • 1.1.3 邮件头的格式和结构
  • 1.1.4 电子邮件传输过程
  • 1.1.5 POP与IMTP
  • 1.1.6 SMTP协议概述
  • 1.2 垃圾邮件
  • 1.2.1 垃圾邮件的定义和产生的原因
  • 1.2.2 垃圾邮件危害和反垃圾邮件研究现状
  • 1.3 垃圾邮件过滤技术
  • 1.3.1 服务器端和用户端邮件过滤
  • 1.3.2 白名单和黑名单
  • 1.3.3 基于规则的垃圾邮件过滤技术
  • 1.3.4 基于内容的垃圾邮件过滤技术
  • 1.3.4.1 基于规则的方法
  • 1.3.4.2 基于统计的方法
  • 1.4 课题来源及主要内容
  • 第二章 相关知识和技术
  • 2.1 LDAP
  • 2.1.1 LDAP概述
  • 2.1.2 LDAP模型
  • 2.1.2.1 信息模型
  • 2.1.2.2 命名模型
  • 2.1.2.3 功能模型
  • 2.1.2.4 安全模型
  • 2.2 向量空间模型
  • 2.3 智能算法
  • 2.3.1 基于信息熵的可伸缩决策树算法
  • 2.3.2 基于变精度粗糙集决策树算法
  • 2.3.3 适应类别增量的决策树算法
  • 2.3.4 快速BP神经网络算法
  • 第三章 系统设计
  • 3.1 设计目标
  • 3.2 总体设计
  • 3.2.1 基于LDAP的系统模型设计
  • 3.2.2 LDAP目录设计
  • 3.2.3 邮件头向量设计
  • 3.2.4 基于信息熵的可伸缩决策树算法的邮件头信息分析机制
  • 3.2.5 基于变精度粗糙集决策树算法的邮件头信息分析机制
  • 3.2.6 基于适应类别增量决策树算法的邮件头信息分析机制
  • 3.2.7 基于快速BP神经网络算法的邮件头信息分析机制
  • 3.3 详细设计
  • 3.3.1 LDAP目录详细设计
  • 3.3.1.1 信息模型设计
  • 3.3.1.2 命名模型的设计
  • 3.3.2 基于LDAP的邮件头信息提取入库模块
  • 3.3.3 生成邮件头信息向量模块
  • 3.3.4 基于信息熵的可伸缩决策树算法的邮件头信息分析机制模块
  • 3.3.5 基于变精度粗糙集决策树算法的邮件头信息分析机制模块
  • 3.3.6 基于适应类别增量决策树算法的邮件头信息分析机制模块
  • 3.3.7 基于快速BP神经网络算法的邮件头信息分析机制模块
  • 第四章 系统实现
  • 4.1 实现环境
  • 4.1.1 Linux平台
  • 4.1.2 Linux C
  • 4.1.3 OpenLdap服务器
  • 4.1.4 WindowsⅡS服务器和PHP
  • 4.2 系统实现
  • 4.2.1 基于LDAP的邮件头信息提取入库功能的实现
  • 4.2.2 生成邮件头信息向量模块的实现
  • 4.2.3 基于信息熵的可伸缩决策树算法的邮件头信息分析机制的实现
  • 4.2.4 基于变精度粗糙集决策树算法的邮件头信息分析机制的实现
  • 4.2.5 基于适应类别增量决策树算法的邮件头信息分析机制的实现
  • 4.2.6 基于快速BP神经网络算法的邮件头信息分析机制的实现
  • 第五章 性能评价
  • 5.1 样本来源
  • 5.2 性能评价
  • 5.2.1 性能指标
  • 5.2.2 基于LDAP的邮件头信息入库性能评价
  • 5.2.3 基于信息熵的可伸缩决策树算法的邮件头信息分析机制性能评价
  • 5.2.4 基于变精度粗糙集决策树算法的邮件头信息分析机制性能评价
  • 5.2.5 基于适应类别增量决策树算法的邮件头信息分析机制性能评价
  • 5.2.6 基于快速BP神经网络算法的邮件头信息分析机制性能评价
  • 5.2.7 四种机制性能比较
  • 第六章 结束语
  • 参考文献
  • 致谢
  • 攻读硕士期间发表的论文
  • 相关论文文献

    • [1].河南2017年出境邮件平均每天9万件[J]. 广东交通 2018(01)
    • [2].疑难邮件七步查询投递法的应用与实践[J]. 邮政研究 2020(01)
    • [3].复工邮件要这样写,才能稳住订单和客户[J]. 进出口经理人 2020(03)
    • [4].垃圾邮件会在2020年消失吗[J]. 计算机与网络 2020(04)
    • [5].政务邮件系统安全第三方评价方法研究[J]. 保密科学技术 2020(01)
    • [6].基于R语言的支持向量机在信息安全与垃圾邮件识别中的应用[J]. 机电工程技术 2016(12)
    • [7].卡巴斯基发布 第三季度垃圾邮件和钓鱼攻击报告[J]. 计算机与网络 2015(24)
    • [8].速递邮件全环节信息化分拣路径及改革措施[J]. 内蒙古科技与经济 2016(03)
    • [9].图像型垃圾邮件检测技术的研究[J]. 电脑编程技巧与维护 2015(17)
    • [10].一枚福建罗山空军的专属“免费军事邮件”戳记[J]. 集邮博览 2019(12)
    • [11].火箭邮件的兴衰[J]. 上海集邮 2020(08)
    • [12].“无预告信息”退回邮件是怎么回事?[J]. 集邮博览 2020(09)
    • [13].邮件[J]. 初中生学习指导 2019(07)
    • [14].火眼金睛 认准垃圾邮件[J]. 电脑爱好者 2009(02)
    • [15].给我6秒,我能收回不该发出的邮件[J]. 电脑爱好者 2009(09)
    • [16].你有新邮件 电脑大声告诉你[J]. 电脑爱好者(普及版) 2009(05)
    • [17].为重要邮件写备注[J]. 电脑迷 2010(02)
    • [18].看过我的邮件后还想骗我 没门儿[J]. 电脑迷 2010(06)
    • [19].职场新鲜人邮件礼仪宝典[J]. 电脑爱好者 2010(10)
    • [20].撤回邮件时间更足[J]. 电脑迷 2010(18)
    • [21].3招清扫信箱 远离垃圾邮件[J]. 电脑爱好者 2010(16)
    • [22].清除多余未读邮件[J]. 电脑迷 2010(24)
    • [23].再简单一点点 邮件也能写日记[J]. 电脑迷 2011(10)
    • [24].制定规则 实现邮件管理自动化[J]. 电脑爱好者 2011(17)
    • [25].已发送邮件 自动保存没商量[J]. 电脑爱好者 2011(19)
    • [26].利用邮件组实现群体发送[J]. 电脑迷 2011(24)
    • [27].阅否 简易的邮件追踪服务[J]. 电脑迷 2012(20)
    • [28].跟踪监控你的邮件[J]. 电脑迷 2014(04)
    • [29].变废为宝 向垃圾邮件学习[J]. 电脑爱好者 2013(22)
    • [30].与垃圾邮件亲密接触[J]. 现代计算机(普及版) 2008(08)

    标签:;  ;  ;  ;  

    基于LDAP的智能邮件头信息分析机制的设计与实现
    下载Doc文档

    猜你喜欢