引力聚类及其应用研究

引力聚类及其应用研究

论文摘要

数据挖掘是近年来热门的计算机应用技术,聚类是数据挖掘中重要的研究分支。聚类技术是将未分类的样本,通过其相似度进行分类,使得类簇内部样本间相似度最大,而不同类簇间相似度最小,从而发现数据集的特性和内部模式。然而,一些数据集的结构和分布呈现高度复杂性,数据挖掘也为聚类带来了大量亟待解决的问题。因此,聚类分析方法进一步研究的空间还很大。层次聚类方法是一种常用的聚类算法,通过分解目标数据集来创建一个层次。按照层次的分解方向,它分为自下而上(凝聚方法)和自上而下(分裂方法)两种类型。覆盖算法是构造型学习算法,通过找到一组覆盖,使得属于同一类的样本属于同一覆盖,不同类的样本不属于同一覆盖。覆盖聚类算法借鉴覆盖算法的构造性思想,找出一组覆盖,使得属于同一覆盖的样本间距离较小,不同覆盖间的样本间距离较大。我们生活的宇宙,从最初的宇宙大爆炸,宇宙所有的物质都处于混沌状态中,杂乱无章。由于万有引力的作用,使得宇宙中的物质相互吸引、靠近,进而融合形成了星系,恒星,行星等天体。这一过程和数据聚类过程极为相似,都是从最初混沌,通过对混沌中的个体进行某种聚类运算,最终得到结构清晰的聚类结果。正是由于这种相似性,我们把万有引力融入聚类算法中,改进相似度的度量方法,即从单纯的距离作为相似度,到距离与类簇的大小比值作为相似度。本文中研究了层次聚类算法(Hierarchical Clustering, HC)和覆盖聚类算法(Covering clustering algorithm, CCA),在这两个算法中,本文用引力替代距离作为相似度计算公式,提出基于引力的层次聚类算法(Hierarchical Clustering Based on Gravity, HCBG)和基于引力的覆盖聚类算法(Covering Clustering Based on Gravity, CCBG)。实验结果表明以引力作为相似度的聚类结果有一定的改进。客户关系管理(Customer Relationship Management, CRM)将最佳的商业实践与数据挖掘、数据仓库、一对一营销、销售自动化以及其它信息技术紧密结合在一起,为企业的销售、客户服务和决策支持等领域提供了一个业务自动化的解决方案。客户细分是CRM技术中一项重要研究内容,通过对客户的有效分类,采用针对性销售策略,达到销售利润最大化。在客户细分中,最重要的两个步骤是数据挖掘和决策支持,数据挖掘即通过聚类算法找出具有相似行为的客户;决策支持即通过贝叶斯分类、决策树等方法,根据某一客户的个人资料,预测他的行为。本文在数据挖掘过程中采用基于引力的层次聚类算法,并通过朴素贝叶斯分类方法,对客户的行为进行了预测。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 数据挖掘概述
  • 1.1.1 数据挖掘产生的背景
  • 1.1.2 数据挖掘的基本概念
  • 1.1.3 数据挖掘的过程
  • 1.2 本文的研究背景
  • 1.3 本文研究内容及组织
  • 第2章 聚类技术
  • 2.1 聚类的概念
  • 2.2 聚类算法的要求
  • 2.3 聚类的数据类型
  • 2.4 聚类的一般步骤
  • 2.5 几种常见的聚类方法
  • 2.5.1 基于划分的方法
  • 2.5.2 基于层次的方法
  • 2.5.3 基于密度的方法
  • 2.5.4 基于网格的方法
  • 2.5.5 基于模型的方法
  • 2.6 聚类结果的评价
  • 2.7 本章小结
  • 第3章 基于引力的层次聚类
  • 3.1 层次聚类的基本原理
  • 3.2 万有引力的基本原理
  • 3.3 基于引力的层次聚类算法(HCBG)
  • 3.3.1 相关定义
  • 3.3.2 基于引力的层次聚类算法
  • 3.3.3 仿真实验及性能评价
  • 3.4 本章小结
  • 第4章 基于引力的覆盖聚类算法
  • 4.1 覆盖算法概述
  • 4.2 覆盖聚类
  • 4.3 基于引力的覆盖聚类算法
  • 4.4 实验结果及分析
  • 4.5 本章小结
  • 第5章 引力层次聚类算法在CRM中应用
  • 5.1 客户细分
  • 5.2 价值客户的特征提取
  • 5.2.1 统计学特征属性
  • 5.2.2 行为学特征属性
  • 5.3 客户价值细分
  • 5.4 基于引力层次模型的客户细分
  • 5.4.1 客户数据筛选
  • 5.4.2 数据聚类实现
  • 5.4.3 用朴素贝叶斯分类
  • 5.4.4 结果分析
  • 5.5 结论
  • 5.6 本章小结
  • 第6章 总结和展望
  • 6.1 本文的主要工作
  • 6.2 进一步的工作
  • 参考文献
  • 致谢
  • 攻读研究生期间发表的论文
  • 相关论文文献

    • [1].线性引力论的引力磁分量及其磁效应[J]. 物理学报 2020(13)
    • [2].论基本引力禀性常数[J]. 科技风 2020(29)
    • [3].引力[J]. 群言 2019(10)
    • [4].认识港口物流中的港口引力[J]. 中国港口 2018(04)
    • [5].厦漳泉经济引力测算[J]. 商 2016(20)
    • [6].分子斥力一定比引力变化快吗[J]. 数理化解题研究 2020(19)
    • [7].太阳与行星间的引力[J]. 中国多媒体与网络教学学报(下旬刊) 2020(07)
    • [8].试论“引力”[J]. 中华武术 2020(07)
    • [9].芬芳的引力[组诗][J]. 诗潮 2019(07)
    • [10].“引力”七问[J]. 物理通报 2010(11)
    • [11].失去引力的世界[J]. 青少年日记 2015(07)
    • [12].引力速度有多快[J]. 大科技(科学之谜) 2013(12)
    • [13].引力[J]. 意林(少年版) 2012(11)
    • [14].神秘的引力[J]. 飞碟探索 2012(02)
    • [15].我们为什么感觉不到地球在转动[J]. 读写算(小学高年级) 2013(04)
    • [16].向上的力量[J]. 初中生 2013(Z4)
    • [17].假如地球失去引力[J]. 新作文(小学1-2-3年级版) 2009(04)
    • [18].假如地球失去了引力[J]. 故事作文(高年级版) 2011(08)
    • [19].幸亏地球有引力[J]. 今日中学生 2008(16)
    • [20].中美战略博弈下的东南亚“地缘引力结构”解析:路径与方法[J]. 社会科学文摘 2020(11)
    • [21].引力关联与黑洞信息丢失之谜[J]. 咸阳师范学院学报 2019(04)
    • [22].引力的本质[J]. 科学通报 2018(24)
    • [23].基于主成分分析法的福建省投资引力研究[J]. 福建商业高等专科学校学报 2014(06)
    • [24].引力[J]. 中国农村金融 2015(13)
    • [25].地球的引力[J]. 疯狂英语(双语世界) 2019(01)
    • [26].熵力:对引力的新阐释[J]. 物理通报 2011(02)
    • [27].引力(外二首)[J]. 江南(诗江南) 2012(01)
    • [28].当地球没有了引力[J]. 小学生之友(中版) 2010(10)
    • [29].引力的迷雾[J]. 飞碟探索 2010(11)
    • [30].宇宙其实没有引力[J]. 大科技(科学之谜) 2011(01)

    标签:;  ;  ;  ;  ;  ;  

    引力聚类及其应用研究
    下载Doc文档

    猜你喜欢