贝叶斯算法在垃圾邮件过滤技术中的研究与应用

贝叶斯算法在垃圾邮件过滤技术中的研究与应用

论文摘要

自互联网技术诞生以来,电子邮件已经成为了最为普遍的应用之一,.成为各类用户必不可少的通讯途径。然而,电子邮件在给广大用户带来方便的同时,也带来了一个极为严重的问题,那就是垃圾邮件。垃圾邮件占用了大量的网络带宽,经常造成网络通信的拥堵,从而使正常的用户无法链接网络或是无法打开正常的邮件。这严重浪费了用户的时间和精力,也造成了网络资源的不合理使用,影响了互联网的信息安全。因此,如何过滤掉互联网上的垃圾邮件并提高过滤效率已经成为邮件提供商和用户的首要问题。垃圾邮件过滤技术的研究在互联网应用技术中具有极其重要的意义。本文通过对电子邮件格式、传输过程、垃圾邮件过滤等相关技术的研究,在贝叶斯算法的基础上设计了一套针对中文垃圾邮件的过滤方案。该方案以黑白名单技术和关键词过滤为辅助,以中文分词和贝叶斯算法为核心,并实现了该垃圾邮件过滤系统。其中,中文分词算法引入了降噪和去停用词处理,同时在贝叶斯过滤过程中通过不断增加样本训练集数量实现了系统的自主学习功能。最后通过邮件样本集和测试集对系统进行了测试,并从文本分类和信息统计学中借鉴了相关的评估参数作为系统的评价体系。测试结果表明,该系统有着较好的垃圾邮件过滤性能。该系统的开发是基于Myeclipse6.5平台,数据库为Oracle,编程语言为javao

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 垃圾邮件历史
  • 1.3 垃圾邮件的危害
  • 1.4 论文主要内容及组织结构
  • 第2章 电子邮件相关技术介绍
  • 2.1 电子邮件的格式
  • 2.1.1 邮件头格式
  • 2.1.2 邮件体格式
  • 2.1.3 完整的邮件格式
  • 2.2 电子邮件的传输基本过程
  • 2.2.1 基本名词
  • 2.2.2 电子邮件发送过程
  • 2.3 相关协议简介
  • 2.3.1 SMTP简介
  • 2.3.2 POP协议
  • 2.3.3 MIME协议
  • 2.3.4 IMAP协议
  • 2.4 本章小结
  • 第3章 邮件过滤相关技术
  • 3.1 邮件过滤技术简介
  • 3.1.1 黑白名单技术
  • 3.1.2 关键词过滤
  • 3.1.3 HASH过滤
  • 3.1.4 启发式过滤
  • 3.1.5 贝叶斯过滤
  • 3.2 中文分词技术
  • 3.2.1 基于理解的分词
  • 3.2.2 基于统计的分词
  • 3.2.3 基于匹配的分词
  • 3.3 贝叶斯算法
  • 3.3.1 贝叶斯过滤算法思想
  • 3.3.2 贝叶斯决策理论
  • 3.3.3 贝叶斯公式相关定义及推导
  • 3.3.4 贝叶斯过滤垃圾邮件的处理过程
  • 3.3.5 贝叶斯过滤的优势
  • 3.4 本章小结
  • 第4章 贝叶斯邮件过滤模型的设计与实现
  • 4.1 算法设计
  • 4.1.1 黑白名单和关键词为辅助的过滤模型
  • 4.1.2 中文分词算法模型
  • 4.2 邮件过滤系统的模块划分
  • 4.2.1 信息处理模块
  • 4.2.2 过滤模块
  • 4.2.3 数据库模块
  • 4.3 本章小结
  • 第5章 系统测试与分析
  • 5.1 系统评价指标
  • 5.1.1 语料选择
  • 5.1.2 评价参数
  • 5.2 系统测试分析
  • 5.2.1 中文分词
  • 5.2.2 训练集结果
  • 5.2.3 阀值的影响
  • 5.3 测试结果分析
  • 5.4. 本章小结
  • 第6章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的论文及科研成果
  • 相关论文文献

    • [1].基于改进贝叶斯原理的垃圾邮件过滤算法研究[J]. 计算机与数字工程 2020(03)
    • [2].基于主题模型的垃圾邮件过滤系统的设计与实现[J]. 电信科学 2017(11)
    • [3].基于贝叶斯算法的垃圾邮件过滤的方法研究[J]. 电脑知识与技术 2017(13)
    • [4].垃圾邮件过滤技术综述[J]. 电脑知识与技术 2016(14)
    • [5].基于图像型垃圾邮件过滤系统的研究[J]. 电子世界 2016(19)
    • [6].浅析邮件系统中垃圾邮件过滤技术[J]. 数码世界 2017(05)
    • [7].一种基于规则的垃圾邮件过滤算法实现[J]. 南方农机 2018(02)
    • [8].贝叶斯垃圾邮件过滤系统的设计与实现[J]. 内蒙古农业大学学报(自然科学版) 2017(03)
    • [9].智能垃圾邮件过滤系统的实现研究[J]. 信息与电脑(理论版) 2016(11)
    • [10].基于行为的垃圾邮件过滤技术研究[J]. 计算机光盘软件与应用 2015(03)
    • [11].一种智能垃圾邮件过滤模型的仿真研究[J]. 计算机仿真 2013(05)
    • [12].基于免疫算法的垃圾邮件过滤技术的研究[J]. 齐齐哈尔大学学报(自然科学版) 2013(03)
    • [13].基于贝叶斯方法的垃圾邮件过滤技术综述[J]. 电脑知识与技术 2013(14)
    • [14].垃圾邮件过滤技术发展现状及展望[J]. 数字技术与应用 2012(05)
    • [15].面向垃圾邮件过滤的典型机器学习算法比较研究[J]. 黑龙江工程学院学报(自然科学版) 2012(02)
    • [16].对垃圾邮件过滤技术的问题研究[J]. 计算机技术与发展 2011(09)
    • [17].图像型垃圾邮件过滤技术研究综述[J]. 计算机系统应用 2011(10)
    • [18].基于机器学习的垃圾邮件过滤技术[J]. 中国科技信息 2010(06)
    • [19].垃圾邮件过滤技术概述[J]. 长江大学学报(自然科学版)理工卷 2010(01)
    • [20].双层垃圾邮件过滤模型研究[J]. 郑州轻工业学院学报(自然科学版) 2010(03)
    • [21].一种基于时间流特性的垃圾邮件过滤方法[J]. 中文信息学报 2009(01)
    • [22].垃圾邮件过滤技术研究[J]. 通信与信息技术 2009(02)
    • [23].实际环境中垃圾邮件过滤测试方法研究[J]. 信息安全与通信保密 2009(04)
    • [24].垃圾邮件过滤技术研究综述[J]. 计算机应用研究 2009(05)
    • [25].决策树在垃圾邮件过滤中的应用[J]. 兰州工业高等专科学校学报 2008(04)
    • [26].基于协同过滤的垃圾邮件过滤系统[J]. 计算机工程 2008(23)
    • [27].基于内容的垃圾邮件过滤技术综述[J]. 黑龙江科技信息 2008(36)
    • [28].垃圾邮件过滤系统的设计[J]. 辽宁石油化工大学学报 2008(01)
    • [29].深度置信网络在垃圾邮件过滤中的应用[J]. 计算机应用 2014(04)
    • [30].改进的贝叶斯算法在垃圾邮件过滤中的应用[J]. 信息通信 2013(09)

    标签:;  ;  ;  ;  

    贝叶斯算法在垃圾邮件过滤技术中的研究与应用
    下载Doc文档

    猜你喜欢