• 面向主题型的网页分类技术的研究与实现

    面向主题型的网页分类技术的研究与实现

    论文摘要搜索引擎是目前使用的最普遍的网络信息检索工具,人们对它有很强的依赖性,搜索引擎大多数采取的是基于关键词匹配检索的策略,但是随着互联网上的信息量与日俱增,这种检索策略的执...
  • 基于URL特征的网页分类研究

    基于URL特征的网页分类研究

    论文摘要互联网提供了大量的广泛分布和高动态资源信息,网页信息分散且不方便管理。网页分类能有效解决这些问题。在网页分类过程中,选取特征是其中重要一环,传统的特征从网页正文、锚文本...
  • 基于Web挖掘的中文网页分类的研究与实现

    基于Web挖掘的中文网页分类的研究与实现

    论文摘要在当今信息时代,网络已经成为人们获取各种信息的主要渠道。其中,网页是承载这些信息的最主要载体。目前,网页数量已经相当庞大,并且每天都还在增长,网页内容也混杂不堪。为了能...
  • 面向Web的XML文档数据管理及分类检索技术研究

    面向Web的XML文档数据管理及分类检索技术研究

    论文摘要随着计算机和互联网技术的发展,网络已经成为资源数量最多、种类最全、规模最大的综合信息库,这些信息大致可分为两类:结构化数据和非结构化数据,据统计,非结构化数据占有整个信...
  • 基于Web挖掘技术的网页分类研究

    基于Web挖掘技术的网页分类研究

    论文摘要随着计算机硬件存储能力和软件环境的不断提高,万维网(WorldWideWeb)数据膨胀使得人们拥有的数据和资源不断增加,万维网的结构也变得更加复杂。万维网数据的海量、异...
  • 企业搜索引擎中网页分类技术的研究与实现

    企业搜索引擎中网页分类技术的研究与实现

    论文摘要近十年来,互联网信息呈现了爆炸式的增长。互联网的迅猛发展使得我们跳出了本地的局限,可以随意访问世界上所有的在线文本。在这种背景下,企业中的网页信息也随着企业规模的扩大而...
  • 网络信息监控分析系统的研究与设计

    网络信息监控分析系统的研究与设计

    论文摘要随着WWW技术的日益成熟和互联网应用的逐渐普及,互联网已经发展成为了一个巨大的分布式信息空间。从Web中获取信息已成为个人获取知识的主要方法和重要手段,也成为当前企业获...
  • 循证医学网络文献的分类方法及其应用研究

    循证医学网络文献的分类方法及其应用研究

    论文摘要循证医学(EBM)已成为国际医学界主流医疗模式,它实施的关键是获取和筛选最佳证据,形成EBM系统评价和实践指南。随着互联网的迅速发展,目前有海量的医学文献以网页的形式出...
  • 基于团结构的文本分类技术研究

    基于团结构的文本分类技术研究

    论文摘要近年来,随着网上电子文档的数量以指数级的速度增长,文本分类技术在信息检索、信息过滤以及内容管理等各项应用中变得越来越重要,已经成为信息检索和机器学习中的前沿研究领域。文...
  • 基于聚类技术的网页分类应用 ——基于后缀树的中文文本聚类方法

    基于聚类技术的网页分类应用 ——基于后缀树的中文文本聚类方法

    论文摘要随着互联网的快速发展,网络在人们日常生活工作中所起到的作用越来越重要。网络已经成为新的信息承载媒体。与此同时,互联网的规模也以爆炸性的速度在扩大。包含着大量信息的海量网...
  • 半监督网页分类及其在目录式搜索引擎中的应用研究

    半监督网页分类及其在目录式搜索引擎中的应用研究

    论文摘要随着网络信息的迅猛发展,包括目录式搜索引擎在内的搜索引擎已成为信息检索的重要工具之一,正成为计算机工业界和学术界争相研究和开发的对象。然而,目录式搜索引擎需要人工介入,...
  • 文本分类新方法的研究与应用

    文本分类新方法的研究与应用

    论文摘要网络技术的快速发展使得互联网上的信息呈现爆炸式的增长。为了有效地利用和管理海量信息,基于内容的信息检索和数据挖掘逐渐成为备受关注的领域。文本分类技术TC(TextCat...
  • 网页去噪音与分类算法研究

    网页去噪音与分类算法研究

    论文摘要随着互联网的快速发展,网络上信息的数量也在急剧增长。互联网给人们提供了大量信息,但同时也给人们快速准确的获取信息带来挑战。为了能有效地利用网页资源,我们需要对网页进行分...
  • 基于体裁的中文网页分类

    基于体裁的中文网页分类

    论文摘要随着通讯及网络技术的发展,人们已经从信息缺乏的时代过渡到信息极为丰富的数字化的时代。以文本格式存储的信息资源的激增,增加了对于快速、自动文本分类的迫切需求。然而,目前大...
  • 中文网页层次分类研究

    中文网页层次分类研究

    论文摘要随着互联网在中国的迅速普及,现在每天中文网页都在以数以万记的速度增加,这无疑给我们带来了巨量信息。那么面对如此庞大的信息,我们迫切需要解决的问题是如何管理和利用这些信息...
  • 基于统计的中文新闻网页分类技术研究

    基于统计的中文新闻网页分类技术研究

    论文摘要随着互联网技术的迅速发展,网络上的信息资源呈爆炸式增长,万维网已经成为拥有几十亿个Web页面的分布式信息空间。在这海量的数字资源中,信息大都以半结构化或者是非结构化的数...
  • 基于结构和主题的Web信息检索研究

    基于结构和主题的Web信息检索研究

    论文摘要随着Internet技术的突飞猛进,Web信息量爆炸性增长,人们越来越习惯使用搜索引擎查找所关心的信息了。但浩瀚的信息资源却给搜索引擎的发展提出了新的挑战。如何有效、快...
  • Web挖掘中的降维和分类方法研究

    Web挖掘中的降维和分类方法研究

    论文题目:Web挖掘中的降维和分类方法研究论文类型:博士论文论文专业:计算机应用技术作者:孙建涛导师:石纯一,陆玉昌关键词:挖掘,网页分类,降维,万维网,点击日志挖掘文献来源:...