选择性聚类融合算法研究

选择性聚类融合算法研究

论文摘要

聚类融合是将不同算法或者同一算法使用不同参数得到的大量聚类成员利用融合函数进行融合,从而获得最终聚类结果。聚类融合已经成为数据挖掘领域的研究热点。但是,传统的聚类融合方法通常将所有产生的聚类成员都参与融合。但是在监督分类学习中,选择分类融合的已经获得了很大的研究进展,对于无监督的选择性聚类融合直到最近几年才逐渐得到重视。研究表明,选择性聚类融合方法能很好地提高聚类分析的准确性等性能。论文针对选择性聚类融合中的数据降维、选择策略、融合函数设计等算法进行了研究,并将选择性聚类融合算法应用于多聚类问题分析中。论文首先对数据降维方法进行了研究,针对传统的PCA降维方法对异常值、噪声敏感问题以及矩阵的秩计算非凸、不连续且计算复杂等问题,提出联合L1范数和迹范数的数据降维模型,针对模型的优化求解提出了基于增强拉格朗日乘子的优化算法。理论的数学分析和可视化的实验结果都表明模型和优化算法的有效性。研究了选择性聚类融合的选择策略问题,理论上证明了联合聚类质量和差异度的选择性聚类融合确实优于融合所有聚类成员的融合算法,针对选择策略中参照成员的确定过于简单问题,提出了基于聚类有效性评价方法的参照成员选择方法,在此基础上,针对聚类成员对最终聚类结果的作用不同,提出了基于容错关系信息熵的属性重要性加权方法,最后论文给出了选择加权聚类融合算法的框架。论文还对算法中的聚类簇数和平衡因子进行了优化分析,并提出基于融合准则函数的聚类簇数优化算法。研究了选择性聚类融合中融合函数的设计问题,提出利用非负矩阵分解(NMF, Nonnegative Matrix Factorization)解决聚类融合问题,在此基础上,引入了谱聚类算法对聚类成员进行分组选择,提出了基于NMF的选择性聚类融合算法。论文进一步分析具有二进制特征的数据,提出了基于二进制矩阵分解(BMF, Binary Non-negative Matrix Factorization)的聚类融合算法和基于BMF的选择性聚类融合算法。通过大量的仿真实验分析发现,对于文本和人工数据集算法准确性大大提高,但对于公共数据集,其准确性不稳定。论文将选择性聚类融合算法应用于多聚类问题分析,提出了基于选择性聚类融合的多聚类算法。算法利用选择性聚类融合技术,形成聚类成员的相似矩阵,基于此矩阵构建聚类成员的层次树,利用基于模块化的方法对层次树进行分割,从而得到多聚类结果。大量的实验结果表明,算法得到的多聚类结果差异度较大,但聚类结果本身的质量较好。论文最后对全文进行了总结,提出了今后将继续进行的研究方向。图21幅,表15个,参考文献132篇。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 选题背景和意义
  • 1.2 相关知识概述
  • 1.2.1 数据降维
  • 1.2.2 聚类和聚类融合
  • 1.2.3 选择性聚类融合
  • 1.3 国内外研究现状
  • 1.4 论文的主要工作
  • 1.5 论文的组织结构
  • 2 数据降维模型及其优化算法研究
  • 2.1 引言
  • 2.2 联合L1范数和迹范数的数据降维模型
  • 2.3 基于增强拉格朗日乘子的优化算法
  • 2.3.1 最优解问题
  • 2.3.2 参数更新问题
  • 2.4 算法框架与算法分析
  • 2.4.1 算法框架
  • 2.4.2 算法分析
  • 2.5 实验分析
  • 2.5.1 UCI公共数据集测试
  • 2.5.2 人脸数据集测试
  • 2.6 本章小结
  • 3 选择性聚类融合算法研究
  • 3.1 引言
  • 3.2 选择策略研究
  • 3.2.1 参照成员的选择
  • 3.2.2 联合聚类质量和差异度的选择策略
  • 3.3 基于容错关系信息熵的属性重要性加权
  • 3.4 算法框架和算法分析
  • 3.5 实验结果和分析
  • 3.6 算法参数分析
  • 3.6.1 聚类簇数优化
  • 3.6.2 平衡因子分析
  • 3.7 本章小结
  • 4 基于非负矩阵分解的融合函数研究
  • 4.1 引言
  • 4.2 基于非负矩阵分解的选择性聚类融合算法
  • 4.2.1 相关理论
  • 4.2.2 基于NMF聚类融合算法
  • 4.2.3 基于谱聚类的聚类成员分组选择算法
  • 4.2.4 算法框架
  • 4.3 基于二进制矩阵分解的聚类融合算法
  • 4.3.1 BMF优化算法
  • 4.3.2 基于BMF的聚类融合算法
  • 4.4 实验分析与比较
  • 4.4.1 公共数据集比较分析
  • 4.4.2 文本数据集比较分析
  • 4.4.3 人工数据集比较分析
  • 4.5 本章小结
  • 5 利用选择性聚类融合解决多聚类问题
  • 5.1 引言
  • 5.2 基于选择性聚类融合的多聚类算法
  • 5.2.1 聚类成员相似性的衡量
  • 5.2.2 层次树的构建和分割
  • 5.2.3 MC-CES算法框架
  • 5.3 实验分析与比较
  • 5.3.1 MC-CES算法与其他聚类融合算法的比较
  • 5.3.2 多个聚类结果比较分析
  • 5.3.3 与元聚类算法比较分析
  • 5.4 本章小结
  • 6 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读博士学位期间主要的研究成果目录
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    选择性聚类融合算法研究
    下载Doc文档

    猜你喜欢