• 面向垂直搜索的网络爬虫设计与实现

    面向垂直搜索的网络爬虫设计与实现

    论文摘要随着互联网的高速发展,互联网上的数据也在超乎人想象的急剧增长,人们对数据和信息的需求也在持续的增长。搜索引擎可以帮助人们从海量的数据中检索出需要的信息和数据,所以搜索引...
  • 基于Internet的音乐推荐系统的设计与实现

    基于Internet的音乐推荐系统的设计与实现

    论文摘要随着Internet的影响深入人们生活的各方各面,其为用户提供的服务越来越趋向于智能化,个性化。与此同时,Internet上可访问的资源数量也呈爆炸性的扩张。针对这样的...
  • 面向主题的双约束网页采集方法的研究和实现

    面向主题的双约束网页采集方法的研究和实现

    论文摘要Web信息分布的局部专题化是互联网信息所呈现的特征之一,伴随着面向主题信息获取的需求越来越多,用户希望主题信息获取能够做到领域信息搜集更完备、更新速度更快、并能够自动发...
  • 基于海量网络舆情信息的热点发现

    基于海量网络舆情信息的热点发现

    论文摘要随着互联网的迅速发展,网络舆情信息在不断的加速增长着。这些海量的信息对社会所造成的影响不能再回避,当前高新科技手段的介入成为了必然,需要一套自动的舆情分析系统,及时有效...
  • 主题搜索引擎的研究与实现

    主题搜索引擎的研究与实现

    论文摘要随着互联网的迅速发展,互联网的信息与日剧增,信息技术的应用让人们无论是生活的便捷还是工作上的效率得到的质的提高。通用搜索引擎的出现为人们提供了更为方便的信息服务。通用搜...
  • 基于Deep Web的图书信息集成与查询系统

    基于Deep Web的图书信息集成与查询系统

    论文摘要该系统是使用在手机上的图书搜索系统,通过搜索,可以为用户提供基本的图书信息查询,并将查询结果显示在手机屏幕上,方便手机用户查阅。在本文中,笔者提供了一种基于DeepWe...
  • 面向主题的搜索引擎的设计与实现

    面向主题的搜索引擎的设计与实现

    论文摘要在社会信息化的高速发展下,网络作为现代最重要的信息发布和交互平台,给人们带来了前所未有的信息资源;同时,也给人们带来了更大的挑战。面对如此丰富的网络资源,如何迅速定位所...
  • 基于学习的恶意网页智能检测系统

    基于学习的恶意网页智能检测系统

    论文摘要随着互联网的高速发展,网络资源的丰富,互联网用户很多时间都在浏览各类网页,然而大量的网页含有恶意代码,在人们浏览网页的时候,恶意代码就会在不被察觉的情况下侵入用户系统,...
  • 基于网络信息提取和网络空间服务的二手房产价格指数编制研究

    基于网络信息提取和网络空间服务的二手房产价格指数编制研究

    论文摘要近年来,随着地方财政对土地出让依赖的增强,房地产开发商对房地产行业暴利的追逐,广大消费者对房地产市场交易的渴望和房地产投资者对房地产市场交易的热衷,国内大中城市房地产市...
  • 网络舆情信息采集系统的设计与实现

    网络舆情信息采集系统的设计与实现

    论文摘要舆论是指在一定的社会空间内,随着某一事件现象的发生、发展、变化,民众对该事件的态度。舆情是舆论的放大体,指民众对社会现象的看法、想法态度及意见的总和,也是民众的社会政治...
  • 基于比对技术的非法网站探测系统的实现与研究

    基于比对技术的非法网站探测系统的实现与研究

    论文摘要二十世纪九十年代出现的万维网(WorldWideWeb),将互联网上的信息资源以图形化的界面直观的显现出来,并且资源之间还可以通过链接相互访问,使我们访问网络信息资源变...
  • Web漏洞扫描系统中的智能爬虫技术研究

    Web漏洞扫描系统中的智能爬虫技术研究

    论文摘要针对Web安全问题,目前最常用的技术是采用Web漏洞扫描系统进行检测。网络爬虫是Web漏洞扫描器重要组成部分,负责抓取站点的页面信息,为Web漏洞扫描器提供数据源及扫描...
  • 垂直搜索引擎及其关键方法研究

    垂直搜索引擎及其关键方法研究

    论文摘要随着Internet的飞速发展,Web己经发展成为包含多种信息资源、站点分布全球的海量信息服务网络。搜索引擎正是一种帮助用户从信息海洋中找到用户所需要信息的工具。一些通...
  • Web挖掘中信息采集技术研究与实现

    Web挖掘中信息采集技术研究与实现

    论文摘要万维网(Web)是世界上规模最大的公共数据源,但Web上信息资源的有效利用是一个难点。Web信息资源大多以HTML文档形式存在,HTML文档的特点决定了它无法作为有效的...
  • 基于布隆过滤器算法的网页消重技术的实现与应用

    基于布隆过滤器算法的网页消重技术的实现与应用

    论文摘要随着Internet的不断发展,网络信息呈指数级不断膨胀,这也给信息检索带来了很大的困难,因此对于重复网页的消重操作也是十分有意义的。本文从理论和应用两方面对网页消重技...
  • 主题搜索引擎的关键技术研究与实现

    主题搜索引擎的关键技术研究与实现

    论文摘要随着网络上信息量的极速增长,Web上出现了大量的重复信息和垃圾信息,用户感觉很难快速找到自己真正需要的信息,通用搜索引擎面临着信息采集规模、更新速度和专业化需求等多方面...
  • Web应用程序安全漏洞挖掘的研究

    Web应用程序安全漏洞挖掘的研究

    论文摘要随着互联网进入web2.0时代,基于web的应用程序受到了广泛的欢迎。web应用程序经常广泛应用在诸如医学、金融、军事等系统中,然而这些领域都是对安全性要求很高的。漏洞...
  • 基于页面分析的主题网络爬虫的研究

    基于页面分析的主题网络爬虫的研究

    论文摘要随着互联网上Web资源的迅猛增长,在庞大的互联网上,快速准确全面地找到与用户查询主题相关的信息变得越来越难。人们对检索质量和速度的要求越来越高,由于传统的全网网络爬虫爬...
  • 基于内容化目录的网络资源搜索研究

    基于内容化目录的网络资源搜索研究

    论文摘要伴随着互联网的高速发展,信息的发布与共享超越了时空的限制。人们进入了一个“信息爆炸”的时代,互联网信息的快速膨胀给人们带来了很多网络资源的同时,也带来了寻找信息的困难。...
  • 基于Groovy的分布式网络爬虫系统的设计与实现

    基于Groovy的分布式网络爬虫系统的设计与实现

    论文摘要随着Internet的发展壮大,人们获取信息的途径逐渐被网络所替代,同时网络信息的增长也达到了惊人的速度。在实际应用中,用户往往有着自己的浏览习惯及特定的主题敏感性,通...