聚类分析及其在文本挖掘中的应用

聚类分析及其在文本挖掘中的应用

论文题目: 聚类分析及其在文本挖掘中的应用

论文类型: 硕士论文

论文专业: 计算机软件与理论

作者: 李健

导师: 武波,马力

关键词: 文本挖掘,聚类分析,文本聚类,算法,特征向量

文献来源: 西安电子科技大学

发表年度: 2005

论文摘要: 随着信息技术的发展,以电子形式存在的文本信息已经成为人们主要的信息来源。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具。近年来针对文本数据的文本挖掘已逐渐成为人们研究的新课题。其中,对于文本聚类的研究已经引起了广泛的重视,并取得了良好的成果。 本文首先对数据挖掘中的聚类分析做了深入的理论研究,以数学的形式表示和讨论了聚类分析中样本类型、样本相似度测量、类的定义等基本概念,分析了五种常用的聚类算法,并对算法性能做了分析与比较。 本文随后对于聚类分析在文本挖掘中的应用——文本聚类做了研究,讨论了将无结构的文本数据转化为聚类算法可以处理的结构化数据的方法和以特征向量形式表示的文本聚类算法。 最后,给出了一个简单的文本聚类模型,并基于K—means文本聚类算法,对模型做了一种设计和实现。

论文目录:

第一章 绪论

1.1 课题背景与意义

1.2 文本挖掘的研究现状

1.2.1 文本挖掘的定义

1.2.2 文本挖掘的分类

1.3 文本聚类

1.4 论文内容的安排

第二章 聚类分析

2.1 聚类分析定义

2.2 样本类型和相似度测量

2.2.1 样本类型

2.2.2 相似度测量

2.3 类的定义

2.4 聚类过程

2.5 聚类分析中的孤立点问题

第三章 几种常用聚类算法的分析与比较

3.1 常用聚类算法的分类

3.2 划分的K-means聚类算法

3.3 层次的利用多代表点聚类算法CURE

3.4 基于高密度连接区域的DBSCAN聚类算法

3.5 基于神经网络模型的SOM算法

3.6 模糊C均值聚类算法FCM

3.7 几种常用聚类算法的比较

3.7.1 聚类算法的评价标准

3.7.2 聚类算法的性能比较

第四章 文本聚类相关技术的讨论

4.1 中文文本预处理技术

4.1.1 文本特征表示与向量空间模型

4.1.2 分词处理与词频统计

4.1.3 文本特征提取

4.1.4 特征项的权重计算

4.2 文本聚类算法

4.2.1 文本聚类的相似度度量及相关定义

4.2.2 基于K-means的文本聚类算法

第五章 一个简单文本聚类模型的设计与实现

5.1 聚类模型

5.2 主要数据结构和模块

5.2.1 数据结构

5.2.2 功能模块

5.3 基于模型的文本聚类实验

5.3.1 实验过程

5.3.2 实验结果分析

第六章 论文总结与展望

致谢

读研期间的研究成果

参考文献

发布时间: 2005-04-26

参考文献

  • [1].聚类分析在Web文本挖掘中的应用研究[D]. 贾丙静.辽宁工程技术大学2007
  • [2].聚类分析在文本挖掘中的应用与研究[D]. 郭建永.江南大学2008
  • [3].基于文本挖掘的外卖O2O平台商家服务质量研究[D]. 邢枫林.广西民族大学2018
  • [4].面向旅游在线评论的文本挖掘方法研究[D]. 严仲培.合肥工业大学2018
  • [5].基于主题的文本挖掘及可视化系统研究与实现[D]. 郭英杰.西安电子科技大学2018
  • [6].基于文本挖掘的个性化推荐系统研究[D]. 崔苹.上海师范大学2018
  • [7].基于专利的技术趋势分析系统的设计与实现[D]. 陈冬冬.北京邮电大学2018
  • [8].基于文本挖掘的用户画像系统的设计与实现[D]. 刘星辰.北京邮电大学2018
  • [9].基于文献计量和知识图谱的文本挖掘研究主题群识别与趋势分析[D]. 许秋雪.延边大学2018
  • [10].基于在线网站评论的中文文本挖掘[D]. 丁诗晴.华中科技大学2016

相关论文

  • [1].文本挖掘关键技术研究及实现[D]. 许高建.合肥工业大学2007
  • [2].聚类分析在Web文本挖掘中的应用研究[D]. 贾丙静.辽宁工程技术大学2007
  • [3].文本挖掘及其在文本检索中的应用[D]. 郑毅.中国科学院研究生院(计算技术研究所)2002
  • [4].文本聚类分析效果评价及文本表示研究[D]. 周昭涛.中国科学院研究生院(计算技术研究所)2005
  • [5].Web文本挖掘中的文本分类研究[D]. 唐剑波.湖南大学2007
  • [6].WEB文本挖掘的聚类分析[D]. 张兆中.山东科技大学2005
  • [7].聚类分析研究及其在文本挖掘中的应用[D]. 杨占华.西南交通大学2006
  • [8].文本挖掘方法探讨及应用[D]. 郭飞.成都理工大学2006
  • [9].数据挖掘中聚类分析的研究[D]. 郭军华.武汉理工大学2003
  • [10].面向文本分类的中文文本挖掘技术研究及实现[D]. 徐爱华.武汉理工大学2004

标签:;  ;  ;  ;  ;  

聚类分析及其在文本挖掘中的应用
下载Doc文档

猜你喜欢