数据挖掘是信息管理领域中一个重要的研究课题,数据挖掘技术已经广泛地应用到很多行业中。聚类分析是数据挖掘中的核心技术之一,目前聚类算法中应用最广泛的k-means算法虽然简明、实用,但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,当样本边界为线性不可分或者样本分布为非高斯分布时,聚类效果较差,无法达到高精确度的聚类要求;而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。而目前核聚类算法中的硬划分方法缺乏健壮性,模糊聚类方法又存在需要人为定义模糊参数等不足,因此有待于进一步改进。本文提出一种改进的模糊核聚类算法——它是将HCM,FCM和核方法结合在一起,该算法的思想是将样本数据映射到特征空间,然后在特征空间内计算类中心、隶属度以及距离表达式,再在特征空间内进行模糊聚类,并且对那些个别样本(即隶属度比较接近的样本)加入了截集因子λ确定样本的归属,确保聚类的效果。实际数据的实验结果表明,与传统的模糊聚类算法相比,改进的模糊核聚类算法在多种数据结构条件下可以有效地进行聚类,总体性能优于HCM,FCM和FKCM。最后将该算法应用到入侵检测技术中,因聚类效果的提高,有效的检测了入侵攻击,并用仿真实验证明该算法入侵检测的有效性
本文来源: https://www.lw50.cn/article/a30b67bf1bca3d23bdb15af1.html