反垃圾邮件技术的研究

反垃圾邮件技术的研究

论文题目: 反垃圾邮件技术的研究

论文类型: 博士论文

论文专业: 计算机系统结构

作者: 詹川

导师: 卢显良

关键词: 垃圾邮件,过滤,贝叶斯算法,学习向量量化网络,特征

文献来源: 电子科技大学

发表年度: 2005

论文摘要: 伴随着Internet的普及,电子邮件以其快捷、方便、低成本的特点已成为互联网上最重要、最普及的应用。但是随之而来的垃圾邮件也越来越泛滥,占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作,生活和学习。如何有效地治理垃圾邮件问题是全世界共同面临的一道难题,也是互联网上目前急待解决的问题。 本文从技术的角度出发,在全面系统学习和总结了国内外反垃圾邮件领域的最新成果的基础上,深入细致地研究了反垃圾邮件技术,取得了以下若干创新和成果。 本文的主要创新和贡献包括: 1、归纳总结了当前垃圾邮件采用的新的抗过滤的方法和手段。垃圾邮件发送者为了让垃圾邮件逃避各种垃圾邮件过滤,不断变化更新欺骗过滤器的方法和手段,目前简单的过滤方法已经无法有效地过滤垃圾邮件。本文在学习了国内外相关资料和研究了大量近期垃圾邮件样本后,归纳总结了当前垃圾邮件发送者常采用的欺骗手段和方法,及其它们的特点,以便有的放矢,更有效地反垃圾邮件。 2、提出了一种基于内容的MNNB垃圾邮件过滤算法。MNNB算法应用Markov链改善了Na(?)ve Bayes垃圾邮件过滤算法中的词条之间相互独立的缺陷,并假设句与句之间是独立的,来简化算法的计算量。实验显示MNNB算法提高了Na(?)ve Bayes算法的准确率和查全率,并且由于该算法不需要分词,对过滤不同语言的垃圾邮件具有更好的适应性。 3、提出了一种基于内容的LVQ神经网络过滤算法。LVQ神经网络算法是先把邮件细分成具体的类别,然后再根据用户的定义,把具体的类别规约成垃圾类邮件和正常类邮件。LVQ神经网络算法克服了垃圾邮件具体类别宽泛,特征离散的问题,提高了垃圾邮件识别的准确度,并且该算法可根据用

论文目录:

第一章 绪论

1.1 研究背景

1.2 垃圾邮件的历史

1.3 垃圾邮件的定义

1.4 垃圾邮件的组成

1.5 邮件用户与垃圾邮件

1.6 反垃圾邮件法律和政策

1.7 电子邮件的工作原理

1.7.1 邮件地址

1.7.2 邮件传送过程

1.7.3 SMTP协议

1.7.3.1 SMTP的基本模型

1.7.3.2 SMTP的缺陷

1.7.4 POP3协议

1.7.5 IMAP协议

1.7.6 邮件格式

1.7.7 MIME协议

1.7.8 Open Relay的原理

1.8 论文主要内容和贡献

1.9 本文结构

第二章 垃圾与反垃圾邮件技术概述

2.1 垃圾邮件的生命周期

2.2 反垃圾邮件技术

2.3 垃圾邮件过滤技术

2.3.1 从角色区分的过滤技术

2.3.1.1 MTA过滤

2.3.1.2 MDA过滤

2.3.1.3 MUA过滤

2.3.2 从方法区分的过滤技术

2.3.2.1 基于关键字符的过滤

2.3.2.2 基于白名单的过滤

2.3.2.3 基于黑名单的过滤

2.3.2.4 反向DNS查询

2.3.2.5 基于规则的过滤

2.3.2.6 基于内容的过滤

2.3.2.7 其他邮件过滤技术

2.4 垃圾邮件反过滤的新方法

2.5 本章小结

第三章 基于MNNB算法的垃圾邮件过滤

3.1 引言

3.2 NA(?)VE BAYES邮件过滤

3.3 MNNB算法

3.4 邮件预处理

3.4.1 邮件正文提取

3.4.2 邮件分词

3.4.2.1 英文分词

3.4.2.2 中文分词

3.4.3 邮件表示

3.4.3.1 向量空间模型

3.4.3.2 项的确定

3.4.3.3 项的权重

3.4.4 特征项选择

3.5 试验分析

3.5.1 训练集和测试集

3.5.2 邮件分类器的评价

3.5.3 试验结果

3.6 本章小结

第四章 基于LVQ的垃圾邮件过滤

4.1 引言

4.2 后向传播算法(BP)

4.3 基于LVQ垃圾邮件过滤

4.3.1 过滤原理

4.3.2 学习矢量量化(LVQ)神经网络

4.3.3 LVQ垃圾邮件过滤模型

4.3.4 LVQTm算法

4.3.5 LVQFlt算法

4.4 实验及结果

4.4.1 试验邮件样本

4.4.2 LVQ邮件过滤神经网络内部设置

4.4.3 试验结果

4.5 本章小结

第五章 基于特征的近似垃圾邮件检测

5.1 引言

5.2 垃圾邮件的特征

5.3 文件相似性的定义

5.4 近似垃圾邮件检测算法(ASD)

5.4.1 垃圾邮件的预处理

5.4.2 样本库的建立

5.4.3 基于特征的ASD查询算法

5.5 性能评价

5.5.1 样本占用的存储空间

5.5.2 运算时间

5.5.3 鲁棒性

5.5.4 准确率和召回率

5.6 本章小结

第六章 基于URL的垃圾邮件过滤

6.1 引言

6.2 HTML格式垃圾邮件的特点

6.3 基于URL垃圾邮件过滤的工作原理

6.4 系统结构

6.5 测试

6.6 本章小结

第七章 服务器端的SPAMSWEEPER系统

7.1 引言

7.2 设计的原则

7.3 系统结构

7.4 SPAMSWEEPER系统流程

7.5 性能评价

7.6 本章小结

第八章 全文总结

参考文献

致谢

作者攻博期间发表的论文和参加的科研工作

发布时间: 2005-09-23

相关论文

  • [1].基于内容的垃圾邮件过滤技术研究[D]. 孙晶涛.兰州理工大学2010
  • [2].图像型垃圾邮件过滤关键技术研究[D]. 李鹏.哈尔滨工业大学2013
  • [3].基于即时分类的垃圾邮件过滤关键技术的研究[D]. 惠孛.电子科技大学2009
  • [4].垃圾邮件检测与过滤关键技术研究[D]. 刘卫红.华南理工大学2010
  • [5].垃圾邮件行为模式识别与过滤方法研究[D]. 王美珍.华中科技大学2009
  • [6].文本分类及其相关技术研究[D]. 李荣陆.复旦大学2005
  • [7].基于P2P的分布式存储及其相关技术研究[D]. 侯孟书.电子科技大学2005
  • [8].文本分类和聚类中若干问题的研究[D]. 杨震.北京邮电大学2007

标签:;  ;  ;  ;  ;  

反垃圾邮件技术的研究
下载Doc文档

猜你喜欢