• 面向石油的主题搜索引擎研究

    面向石油的主题搜索引擎研究

    论文摘要近年来,我国石油行业信息化建设发展迅速,但针对石油专业信息检索的主题搜索引擎却寥寥无几。现有的搜索引擎相关技术大多面向综合型搜索引擎,对主题信息检索的研究并不完善,因此...
  • 基于文本分类技术的信息过滤方法的研究

    基于文本分类技术的信息过滤方法的研究

    论文摘要Internet的迅速发展给人们带来诸多方便的同时,也带来了诸如信息过载、信息迷失、色情和暴力充斥网上等很多问题,为解决这些问题,信息过滤应运而生。中文文本信息过滤是中...
  • 一种基于向量空间模型的商品分类算法

    一种基于向量空间模型的商品分类算法

    论文摘要近年来,随着万维网的广泛应用,电子商务也渐渐引起了人们的关注。无论是供应商还是消费者,都被电子商务突破时间和空间的限制所带来的便捷所吸引。与传统的商务活动相比较,电子商...
  • 潜在语义索引分类模型的研究与改进

    潜在语义索引分类模型的研究与改进

    论文摘要针对向量空间模型表示法的局限性,采用潜在语义索引在语义层面进行处理,是近几年提出的一种文本表示方法。潜在语义索引是利用统计计算导出文本中的潜在的语义进行索引,而不是在传...
  • 中文文本自动分类系统的研究与实现

    中文文本自动分类系统的研究与实现

    论文摘要本文讨论文本分类技术和方法。第一章介绍了自动文本分类技术的产生背景及其意义,包括自动文本分类的问题描述、评价方法以及技术的种类,综述了国外技术的研究现状。第二章介绍中文...
  • 基于信息增益的中文特征提取算法研究

    基于信息增益的中文特征提取算法研究

    论文摘要随着网络和信息技术的飞速发展,人们可获得的知识越来越多,但是要快速、准确地定位需要的信息却越来越困难。如何在海量的信息中提取有价值的信息成为信息处理的一大热点,各种信息...
  • 支持语义的对等计算信息检索技术研究

    支持语义的对等计算信息检索技术研究

    论文摘要对等计算是未来重构基于Internet应用的关键技术之一。对等计算的核心思想是所有参与系统的节点都拥有对等的功能与责任,可以随时自由地加入或离开该系统,形成一个真正动态...
  • 基于实例学习的搜索引擎结果优化系统设计与实现

    基于实例学习的搜索引擎结果优化系统设计与实现

    论文摘要搜索引擎是网络信息检索的主要工具,它的出现方便了人们对信息的查询,但现有搜索引擎返回的结果太多,用户很难查找到真正想要的资料。此外,人们通常无法用简单的几个词来描述自己...
  • 基于领域本体的答疑网格系统研究

    基于领域本体的答疑网格系统研究

    论文摘要网络技术的高速发展,使得远程教育越来越受到人们的关注。这种基于网络的教育模式将教师和学生分离开来,无法进行面对面的交流与解释,学习者必须进行自主学习。网上答疑系统能够及...
  • Web新闻专题组织与生成系统研究

    Web新闻专题组织与生成系统研究

    论文摘要随着互联网的迅猛发展与普及,Web新闻信息呈爆炸式的增长。人们希望方便快捷地从海量的Web新闻中获取自己感兴趣的信息,并能了解某一突发的新闻事件或热点事件的前因后果和来...
  • 基于KNN及相关链接的中文网页分类研究

    基于KNN及相关链接的中文网页分类研究

    论文摘要随着Internet的飞速发展,网上信息正在呈指数级增长。面对杂乱的网页信息资源,人们需要对海量的网页信息进行分类整理,从而可以快速检索到期望的目标及其关联信息。网页自...
  • 在线社会网络模糊挖掘模型研究

    在线社会网络模糊挖掘模型研究

    论文摘要近些年来,在线社会网络OSN(OnlineSocialNetwork)获得了空前的发展,成为了学界术和商业界的重要研究领域。从内容相似性的角度进行OSN的挖掘研究,将是...
  • WEB文本模糊分类及其预处理的研究与实现

    WEB文本模糊分类及其预处理的研究与实现

    论文摘要随着Internet的迅速发展,尤其是WorldWideWeb的全球普及,Web上信息资源已涵盖了社会生活的各个方面,网络信息过载问题日益突出。处理海量数据的一个重要方...
  • 主题爬虫的研究与实现

    主题爬虫的研究与实现

    论文摘要通用搜索引擎,在很大程度上解决了人们在Web上查找信息的困难,但是随着信息多元化的增长,也存在着种种不足。如:查准率查全率低、内容相对陈旧、信息分布不平衡等。因此,主题...
  • 基于停用词处理的汉语语音检索方法

    基于停用词处理的汉语语音检索方法

    论文摘要随着互联网和多媒体技术的发展,语音资料的数量迅速膨胀。快速有效地进行语音资料的检索变得越来越重要。语音检索作为语音识别研究中的一个新领域,其目的是在大量语音资源中搜索与...
  • 文本挖掘预处理相关基础技术分析与应用研究

    文本挖掘预处理相关基础技术分析与应用研究

    论文摘要本论文将在对比分析并发现现有文本挖掘技术存在不足的基础上,提出改进文本预处理精度的算法。文中涉及的主要技术包括文本收集、文本预处理、处理后的文本的中文分词、预抽取训练样...
  • 领域本体构造中数据源选取及构造方法的研究

    领域本体构造中数据源选取及构造方法的研究

    论文摘要本体构造方法的研究有利于本体的广泛应用和推广,尤其对WWW向下一个版本转化具有现实意义。目前,本体构造多侧重在方法过程的研究,如果能够加强对本体数据源内部特征的分析,会...
  • 蒙文文本分类技术研究与系统设计实现

    蒙文文本分类技术研究与系统设计实现

    论文摘要随着信息技术的发展和网页数量的迅速增长,出现了大量的电子文档。如何利用好这些电子文档便成为了信息技术的一项重要课题。文本分类作为一种处理和组织文本数据的方法,其目的是为...
  • 中文邮件过滤系统的研究与实现

    中文邮件过滤系统的研究与实现

    论文摘要电子邮件已经成为人们日常生活中通信、交流的重要手段之一。然而,大量出现的垃圾邮件,给用户造成了时间和资源上的浪费,同时也极大地消耗了网络传输资源以及邮件服务器的存储空间...
  • Web数据挖掘及其在信息监控中的应用研究

    Web数据挖掘及其在信息监控中的应用研究

    论文摘要本文是针对开发网络监控部门所需的信息监控系统的实际研发过程拟就的。随着Web信息的速度增长,有害信息也随之增加。开发一个方便、快捷的监控系统,以便有效地发现Web网页上...