Web预取中的数据挖掘研究

Web预取中的数据挖掘研究

论文摘要

虽然近几年来网络速度有了很大的提高,但是由于接入Internet 的用户数量急剧增加以及Web 服务和网络的固有延迟,使得网络越来越拥挤,用户浏览网页时经常会出现网页打开过慢的问题。如果仅仅靠通过对网络硬件设备的提高来解决网络速度问题已经变得不符合实际。本文在研究了Web 预取技术的基础上,提出一种新的预取策略,这种新的预取策略可以加快用户浏览网页的速度。本文首先分析了目前已经存在的Web 预取方法,然后利用数据挖掘技术,建立了Web 预取模型。在Web 预取模型的基础上,分别定义了二元预取策略和多元预取策略。二元预取策略比较简单,但是由于需要多次进行分析和预测,在实际应用中效率低下。由于用户浏览网页的兴趣是一个兴趣链,他会根据网页提供的链接一直访问下去,因此可以对用户的兴趣进行挖掘,从而得到用户一系列的兴趣模型。有了这些兴趣模型,就可以在用户浏览一个网页时对一系列网页进行预取,而不用以后再进行分析和预测,这就是多元预取策略。多元预取策略大大减少了预测的次数。本文最后利用VB.Net 开发了一个预取试验平台,并对二元预取策略和多元预取策略分别进行分析,验证了其优化的性能。试验表明,预取策略对提高用户浏览网页的速度十分有效。

论文目录

  • 第一章 绪论
  • 1.1 论文的研究背景
  • 1.2 论文的意义
  • 1.3 论文的主要内容
  • 第二章 Web 预取技术的研究
  • 2.1 Web 预取的理论依据
  • 2.2 预取的系统结构
  • 2.3 预取算法的基本思想
  • 第三章 Web 数据挖掘研究和系统建模
  • 3.1 Web 数据挖掘综述
  • 3.1.1 Web 数据的特点
  • 3.1.2 Web 数据挖掘的原理
  • 3.1.3 Web 数据挖掘的分类
  • 3.2 关联规则挖掘
  • 3.2.1 关联规则的基本概念
  • 3.2.2 关联规则的基本形式
  • 3.3 运用关联规则方法建立Web 数据挖掘模型
  • 第四章 基于二元规则的预取策略
  • 4.1 定义简化的WWW 模型
  • 4.2 定义兴趣关联知识库
  • 4.3 二元规则预取策略
  • 4.4 二元规则预取策略的优点和不足
  • 第五章 多元规则预取策略
  • 5.1 关联规则合并算法
  • 5.2 规则选取方法
  • 5.3 多元规则预取策略
  • 第六章 程序设计及实现
  • 6.1 程序的架构设计
  • 6.2 数据库设计
  • 6.3 类结构说明
  • 6.4 实例研究
  • 6.4.1 二元预取模型试验分析
  • 6.4.2 多元预取模型的试验分析
  • 6.4.3 预取大小分析
  • 第七章 总结和展望
  • 7.1 总结
  • 7.2 本文的创新点
  • 7.3 展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文和科研项目
  • 论文独创性声明
  • 论文使用授权声明
  • 相关论文文献

    • [1].基于WEB的通信电源远程监控系统研究[J]. 中国设备工程 2019(24)
    • [2].基于自适应遗传算法的考虑服务质量感知Web服务发现[J]. 电子测量技术 2019(22)
    • [3].面向Web系统热点数据预测及缓存管理的研究[J]. 信息技术与信息化 2019(12)
    • [4].基于页面对象的Web应用测试用例生成方法[J]. 计算机应用 2020(01)
    • [5].运用物联网和Web服务搭建院际转运信息平台[J]. 电子技术与软件工程 2020(02)
    • [6].延迟加载在web开发中的应用心得[J]. 视听 2020(02)
    • [7].基于Web的期刊采编系统的设计与实现[J]. 电脑知识与技术 2020(06)
    • [8].Web服务软件测试技术的研究与实现[J]. 电脑知识与技术 2020(02)
    • [9].移动互联网时代的Web性能优化实践[J]. 信息通信 2020(01)
    • [10].基于Web的校园个人自行车租赁系统[J]. 卫星电视与宽带多媒体 2020(02)
    • [11].基于网站制作的Web前端开发技术与优化[J]. 数字技术与应用 2020(01)
    • [12].基于Web应用的网络安全漏洞发现与研究[J]. 无线互联科技 2020(05)
    • [13].基于Web的动态几何软件领域模型及其应用[J]. 计算机应用 2020(04)
    • [14].基于web技术支持下网络多媒体课件的制作原则及优点[J]. 科技风 2020(13)
    • [15].基于Web的网上教学平台的设计与实现[J]. 科技与创新 2020(07)
    • [16].1+X证书制度与Web前端开发专业融合的探索[J]. 信息与电脑(理论版) 2020(04)
    • [17].基于《web前端页面设计》在线开放课程自主学习探讨[J]. 计算机产品与流通 2020(05)
    • [18].基于WEB的计算机课程辅助教学系统的设计与实现[J]. 计算机产品与流通 2020(05)
    • [19].基于Web的时变体数据的体绘制方法[J]. 计算机测量与控制 2020(04)
    • [20].Web浏览器中数据安全配置的研究[J]. 电脑编程技巧与维护 2020(04)
    • [21].基于实践应用的Web开发技术教学改革研究初探[J]. 科学大众(科学教育) 2020(05)
    • [22].基于Web的桥梁健康监测系统设计与实现[J]. 计算机技术与发展 2020(04)
    • [23].基于Web技术的计算机实验室综合管理系统设计[J]. 电子制作 2020(11)
    • [24].分析校园网中Web服务器的配置及安全防护[J]. 江西电力职业技术学院学报 2020(01)
    • [25].基于Web的研究生学位信息管理系统技术研究[J]. 创新创业理论研究与实践 2020(07)
    • [26].WEB技术在地质资料二次开发中的应用探讨[J]. 中国非金属矿工业导刊 2020(03)
    • [27].基于Web技术的医疗图像脱敏系统的设计与实现[J]. 宁夏工程技术 2020(02)
    • [28].网站制作的Web前端开发设计的相关研究[J]. 卫星电视与宽带多媒体 2020(07)
    • [29].Web开发提高网站性能的技巧[J]. 电脑编程技巧与维护 2020(06)
    • [30].随钻测井地质导向服务WEB版[J]. 国外测井技术 2020(03)

    标签:;  ;  ;  ;  ;  

    Web预取中的数据挖掘研究
    下载Doc文档

    猜你喜欢