基于区间数的不确定性数据挖掘及其应用研究

基于区间数的不确定性数据挖掘及其应用研究

论文摘要

尽管数据挖掘技术已经成功应用到很多领域,但是由于测量手段的局限性以及客观对象本身不确定性等原因,在自然和社会科学领域中存在大量待挖掘的数据是不准确、不确定的。如果不充分考虑这些数据的不确定性,不采用合适的数据挖掘方法,那么必然会导致挖掘模型性能下降,甚至是不可接受的。如何从大量不确定性数据中找出隐藏的知识,仍然是人们研究的主要课题。根据待挖掘数据所依据的不确定理论,不确定性数据挖掘方法可分为4种类型:随机数据挖掘、灰色数据挖掘、模糊数据挖掘和区间数数据挖掘方法。本文以国家863项目钢铁生产过程的质量控制为研究背景,为解决生产过程数据不完整、不确定、大数据量的数据挖掘困难问题,提出基于SVM以及核方法的区间数数据挖掘建模方法,并用于钢铁生产过程的质量预测和质量分析。本文主要工作包括以下几个方面:1.提出了两种区间数回归建模方法。针对钢铁工业过程中的实际需要,本文提出两种区间数回归建模方法:(1)基于SVM的区间数输入、区间数输出回归建模方法。该方法把SVM从实数回归分析推广到区间数回归分析,同时继承了SVM的优点;(2)基于SVM的精确数输入、区间数输出的回归分析建模方法。该方法对区间数上下界逼近回归建模的同时还考虑了上下界之间的相互信息。本算法能通过解凸二次最优化问题得到全局最优解,有效地避免了回归模型的上界小于下界的问题。2.提出了基于多尺度径向基小波SVM的精确数输入、区间数输出的鲁棒回归分析建模方法。首先提出并使用基于多尺度径向基小波SVM方法对带有离群点的多尺度区间数样本数据集进行训练,分别得到区间数上下界初始回归模型,初始回归模型不仅能够有效地逼近多尺度样本信号、具有较好的鲁棒性和推广性能,而且在正常样本点处残差较小,在离群点处残差较大;然后以加权M—估计函数作为代价函数,并使用梯度下降法同时调整区间数上下界回归模型参数,且根据间数上下界模型输出关系改变加权系数,消除了离群点对区间数回归模型的影响,解决了区间数模型输出上界小于下界的问题。3.提出了基于SVM的区间数分类建模方法。根据区间数的比较定义,该方法把区间数线性分类器转化为精确数输入的线性分类器,从而能够建立基于SVM的区间数分类器模型。本文通过设计合适的核函数,把区间数数据样本映射到高维特征空间,然后在高维空间中对样本数据进行线性分类,顺利地解决了区间数样本线性不可分问题,克服了现有的区间数分类算法对输入维数敏感以及不适合大量数据样本等问题。4.提出一种基于核方法的区间数模糊聚类算法。本文通过设计合适的核函数,有效地扩大样本模式之间的差异性,提高聚类算法对非对称数据以及混合数据模式的适应能力,且避免了直接在高维特征空间求解聚类问题。采用区间数遗传算法来求解非凸聚类优化问题得到聚类问题的全局最优解,大大提高了聚类质量。该方法解决了现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题。5.以钢铁生产过程为应用背景,阐述了基于区间数的不确定性数据挖掘在实际生产中的应用,并与其它方法相对比。结果表明,本文提出的数据挖掘方法能够克服现有算法的缺点,并在钢铁过程的数据挖掘中取得较好的效果。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 数据挖掘
  • 1.2 数据挖掘面临的问题
  • 1.3 不确定性数据挖掘的来源及其研究意义
  • 1.3.1 不确定性数据挖掘在生产实践的来源
  • 1.3.2 不确定性数据挖掘研究内容
  • 1.4 不确定性数据挖掘研究现状
  • 1.4.1 随机数据挖掘
  • 1.4.1.1 基于统计学理论的随机数据挖掘
  • 1.4.1.2 基于粗糙集理论的随机数据挖掘
  • 1.4.2 灰色数据挖掘
  • 1.4.3 模糊数据挖掘
  • 1.4.4 区间数数据挖掘
  • 1.4.4.1 区间分析理论
  • 1.4.4.2 区间数数据挖掘研究内容
  • 1.4.4.3 基于区间分析和其它不确定理论相结合的数据挖掘
  • 1.5 区间数数据挖掘未来研究方向
  • 1.6 论文的研究内容及结构
  • 第2章 预备知识
  • 2.1 引言
  • 2.2 区间数运算
  • 2.3 区间数的扩展运算
  • 2.3.1 区间数函数
  • 2.4 支持向量机理论
  • 2.4.1 SVM分类建模方法
  • 2.4.1.1 SVM线性分类建模方法
  • 2.4.1.2 SVM非线性分类算法
  • 2.4.2 SVM回归方法
  • 2.4.2.1 SVM线性回归方法
  • 2.4.2.2 SVM非线性回归方法
  • 2.5 本章小结
  • 第3章 基于SVM的区间数回归分析建模方法
  • 3.1 引言
  • 3.2 基于SVM的区间数输入、区间数输出的回归分析建模方法
  • 3.2.1 引言
  • 3.2.2 区间数线性回归算法
  • 3.2.2.1 相关知识
  • 3.2.2.2 问题描述
  • 3.2.2.3 基于SVM的区间数回归问题求解
  • 3.2.3 区间数非线性回归算法
  • 3.3 基于SVM的精确数、区间数回归模型建模方法
  • 3.3.1 引言
  • 3.3.2 问题的提出
  • 3.3.3 基于SVM的区间数线性回归建模
  • 3.3.4 基于核函数的区间数非线性回归模型
  • 3.4 本章小结
  • 第4章 基于多尺度径向基小波SVM的区间数鲁棒回归分析建模方法
  • 4.1 引言
  • 4.2 问题的提出
  • 4.2.1 M-估计
  • 4.2.2 问题描述
  • 4.3 基于径向基小波核的多尺度小波支持向量机
  • 4.3.1 引言
  • 4.3.2 问题描述
  • 4.3.3 径向基小波支持向量核
  • 4.3.4 多尺度径向基小波SVM
  • 4.3.5 仿真实例
  • 4.4 基于多尺度WSVM的区间数鲁棒回归分析建模算法
  • 4.4.1 基于多尺度WSVM的区间数回归分析
  • 4.4.2 鲁棒学习算法
  • 4.5 本章小结
  • 第5章 基于SVM的区间数分类建模方法
  • 5.1 引言
  • 5.2 基于SVM的区间数线性分类器
  • 5.2.1 区间数比较
  • 5.2.2 区间数线性分类建模
  • 5.3 区间数非线性分类器模型
  • 5.4 本章小结
  • 第6章 基于核方法的区间数模糊聚类算法
  • 6.1 引言
  • 6.2 问题描述
  • 6.3 基于遗传算法的聚类问题求解
  • 6.4 本章小结
  • 第7章 区间数数据挖掘在钢铁生产过程的应用
  • 7.1 引言
  • 7.2 钢铁生产过程数据挖掘面临的挑战
  • 7.3 连续退火过程区间数数据挖掘
  • 7.3.1 连续退火生产工艺
  • 7.3.2 基于区间数输入、区间数输出回归模型的加热段出口带钢温度预测
  • 7.3.3 基于精确数输入、区间数输出回归模型的冷却段出口带钢温度预测
  • 7.3.4 基于区间数鲁棒回归模型的冷却断出口带钢温度预测
  • 7.4 连续铸造过程中的铸坯质量分析
  • 7.4.1 连铸生产过程工艺
  • 7.4.2 基于区间数分类算法的铸坯质量预测
  • 7.4.3 基于区间数模糊聚类算法的铸坯质量分析
  • 7.5 本章小结
  • 第8章 工作总结与研究展望
  • 8.1 工作总结
  • 8.2 研究展望
  • 参考文献:
  • 附录
  • 攻读博士学位期间发表和录用的文章
  • 攻读博士学位期间已投稿文章
  • 攻读博士学位期间参加的科研项目及受到的奖励
  • 致谢
  • 相关论文文献

    • [1].基于区间数距离的铁路线路方案决策模型与方法[J]. 西南交通大学学报 2019(04)
    • [2].掌控函数零点所在的区间[J]. 中学生数理化(学习研究) 2017(05)
    • [3].群决策的区间数判断矩阵最优集结及专家评判水平评价研究[J]. 赤峰学院学报(自然科学版) 2020(09)
    • [4].中小航运企业可持续发展能力区间数评价[J]. 中国航海 2018(03)
    • [5].基于区间数排序的住房选择方案评价研究[J]. 工程管理学报 2016(05)
    • [6].基于区间数排序的目标识别系统威胁评估方法[J]. 探测与控制学报 2015(06)
    • [7].群决策中两类区间数判断矩阵的集结方法研究[J]. 中国管理科学 2015(S1)
    • [8].基于区间数距离的模式识别方法[J]. 洛阳理工学院学报(自然科学版) 2015(02)
    • [9].基于三元区间数的模糊综合评判方法及应用[J]. 内蒙古民族大学学报(自然科学版) 2014(02)
    • [10].基于区间数排序可能度法的施工方案评价方法研究[J]. 工程管理学报 2013(05)
    • [11].基于纯策略的区间数矩阵博弈模型的研究[J]. 重庆理工大学学报(自然科学) 2012(02)
    • [12].区间数互反判断矩阵一致性及排序[J]. 系统工程 2008(09)
    • [13].区间数排序的粗糙集方法[J]. 大连理工大学学报 2008(01)
    • [14].标准区间数及其在机构误差分析中的应用[J]. 机床与液压 2008(02)
    • [15].灾害损失评估的三参数区间数模糊综合评判法[J]. 自然灾害学报 2008(05)
    • [16].关于区间数绝对值运算的几个结果[J]. 纺织高校基础科学学报 2019(03)
    • [17].n参数区间数的多属性决策方法及其应用[J]. 内江科技 2017(06)
    • [18].基于三参数区间数多属性决策问题的权重确定[J]. 内江科技 2017(07)
    • [19].求解非线性区间数规划的微免疫优化算法研究[J]. 计算机研究与发展 2014(12)
    • [20].区间数运算法则的研究[J]. 数学学习与研究 2015(03)
    • [21].基于三元区间数的鸟撞座舱盖的不确定性分析[J]. 广西大学学报(自然科学版) 2012(05)
    • [22].一种基于多维区间数可能度的投资决策方法[J]. 统计与决策 2011(16)
    • [23].基于区间数排序的水环境质量评价方法研究[J]. 环境科学与管理 2010(02)
    • [24].基于区间数组合赋权的水库调度方案评价研究[J]. 中国农村水利水电 2019(04)
    • [25].基于区间数理论的惯组贮存稳定性分析方法[J]. 计算机仿真 2019(03)
    • [26].工时不确定条件下基于改进遗传算法的柔性作业车间调度问题的区间数求解方法[J]. 机械工程师 2018(01)
    • [27].基于多区间数的决策方法[J]. 统计与决策 2017(03)
    • [28].煤与瓦斯突出预测指标的区间数关联决策模型[J]. 辽宁工程技术大学学报(自然科学版) 2015(11)
    • [29].基于时序区间数的多属性决策方法[J]. 重庆师范大学学报(自然科学版) 2014(02)
    • [30].三端点区间数互反判断矩阵的排序方法研究[J]. 中国管理科学 2012(02)

    标签:;  ;  ;  ;  ;  ;  ;  ;  

    基于区间数的不确定性数据挖掘及其应用研究
    下载Doc文档

    猜你喜欢