• Web文本聚类技术及聚类结果可视化研究

    Web文本聚类技术及聚类结果可视化研究

    论文摘要随着Internet和计算机网络技术的飞速发展,Web已经成为一个海量的、动态的、异构的信息资源库。人们急需从大量的Web数据资源中快速、有效地获取感兴趣的知识和模式。...
  • 基于本体的中文文本聚类技术研究

    基于本体的中文文本聚类技术研究

    论文摘要近年来,随着Internet技术的发展和信息传播手段的进步,人们可以从互联网上得到的信息越来越丰富,尤其可以获得数目惊人的文本文档。如何对这些文档进行有效的导航、总结、...
  • 基于潜在语义索引的文本聚类算法研究

    基于潜在语义索引的文本聚类算法研究

    论文摘要随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访问的效率。文本聚类技术具有较强的灵活性和自动处...
  • 聚类分析在文本挖掘中的应用与研究

    聚类分析在文本挖掘中的应用与研究

    论文摘要在现实世界中,文本是信息最重要的载体,事实上,研究表明信息有80%包含在文本文档中。特别是在互联网上,文本数据广泛地存在于各种形式,如新闻报道、电子图书、研究论文、数字...
  • 基于k-平均算法的文本聚类系统研究与实现

    基于k-平均算法的文本聚类系统研究与实现

    论文摘要随着国际互联网和企业内部互联网的飞速发展,各种电子文本数据的数量急剧增加,如何快速有效的获取、管理和使用这些文本数据,已经成为信息系统学科迫切需要解决的重要问题。近年来...
  • BBS热点话题挖掘与观点分析

    BBS热点话题挖掘与观点分析

    论文摘要随着互联网的飞速发展,BBS(即网络论坛)已经成为人们自由发表言论,表达民意的重要平台。政府和网管部门需要利用有效的智能技术,对BBS进行舆情监控,以便及时掌握各个时期...
  • 基于边界距离的文本聚类方法研究

    基于边界距离的文本聚类方法研究

    论文摘要文本聚类是自然语言处理研究中一项重要研究课题,文本聚类技术广泛地应用于信息检索、Web挖掘和数字图书馆等领域。论文介绍了目前国内外文本聚类技术的研究现状,阐述了几种具有...
  • 基于特征短语的网页在线聚类方法

    基于特征短语的网页在线聚类方法

    论文摘要随着互联网技术的飞速发展,网络为我们提供了多元化的海量信息,越来越多的人开始使用搜索引擎来获取所需要的信息。然而,虽然搜索引擎发展迅速,但其效果远未达到令人满意的程度,...
  • 基于DK-Means算法的文本聚类的研究与实现

    基于DK-Means算法的文本聚类的研究与实现

    论文摘要随着信息技术在各个领域的普及,各种应用每天产生的数据量呈指数级增长。如何有效处理这些数据,从中提取有用的知识,是迫切需要解决的问题。数据挖掘是为了满足人们对数据中所蕴涵...
  • 隐式用户兴趣挖掘的研究与实现

    隐式用户兴趣挖掘的研究与实现

    论文摘要数据挖掘作为一种知识发现的手段,得到了广泛的应用,是数据库最活跃的领域之一。Web挖掘就是将传统的数据挖掘技术应用到Web环境中,从Web中抽取信息或知识的过程。在We...
  • 文本挖掘中若干关键问题的研究

    文本挖掘中若干关键问题的研究

    论文摘要文本挖掘是指从文本数据中获取可理解的、可用的知识的过程,其涉及数据挖掘、模式识别、信息检索、自然语言处理等多个领域的内容。本文针对文本挖掘中的若干关键问题,例如文本分类...
  • 非监督的结构学习及其应用

    非监督的结构学习及其应用

    论文摘要在机器学习领域中,数据的表示方式是其中的核心问题。传统的方法经常通过特征向量的方式将数据表示为高维空间中的点。特征向量的表示方式由于简单直观的特性得到广泛的研究。但是,...
  • 文本挖掘算法及其在知识管理中的应用研究

    文本挖掘算法及其在知识管理中的应用研究

    论文摘要随着知识经济的到来,知识管理在社会经济中的作用日益重要。大多数的知识管理研究是为企业服务的,针对科研管理部门的知识管理研究非常少,本文对我国科研管理部门的知识管理问题进...
  • 短语消息聚类相关技术研究

    短语消息聚类相关技术研究

    论文摘要随着互联网和通信技术的发展,InstantMessaging、InternetRelayChat等即时通信工具得到广泛普及和应用。这些即时通信工具往往产生大量的、用于人...
  • 一种优化的顺序IB文本聚类算法

    一种优化的顺序IB文本聚类算法

    论文摘要随着网络信息的飞速增长,对于文本聚类技术的研究显得更为重要。由于文本数据高维性和稀疏性,传统的文本聚类算法并不能让人满意。IB方法是基于信息论的数据分析方法,该方法通过...
  • 数据挖掘算法在智能答疑系统中的应用研究

    数据挖掘算法在智能答疑系统中的应用研究

    论文摘要数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一。数据挖掘指的是从大型的数据库或数据仓库中提取人们感兴趣的知识,这些知识是隐含的,事先未知的潜在有用信息。数据...
  • 基于内容的中文Web文档聚类方法研究与应用

    基于内容的中文Web文档聚类方法研究与应用

    论文摘要随着Internet的飞速发展,对网页文本数据的组织和检索技术,已成为当今国际上研究热点之一。文本聚类作为一种对大规模文本信息进行有效组织、导航、检索和概括汇总的基础、...
  • 海量短语信息挖掘技术的研究与实现

    海量短语信息挖掘技术的研究与实现

    论文摘要互连网和信息技术的飞速发展造成海量的数据积累,其中很大一部分是短文数据,如文章摘要和聊天室的会话。对海量的短文数据进行自动的分析和挖掘,从中获取有价值的隐含知识,已经成...
  • 文本信息处理的若干关键技术研究

    文本信息处理的若干关键技术研究

    论文摘要随着信息时代的到来和Internet的日益普及,文本信息迅速膨胀。Internet上有数十亿的网页,成千上万TB的数据。而且,每天有数十万的网页更新,数百万的新的网页加...
  • 基于动态簇中心迁移的聚类算法及应用

    基于动态簇中心迁移的聚类算法及应用

    论文摘要随着Internet的迅速发展,大量信息不断膨胀。如何从大量的信息中提取知识是广大科研工作者研究的重点。而这些信息的多数都是以文本的形式存在的。文本聚类方法作为文本挖掘...