基于数据几何特性的概率推理和统计学习研究

基于数据几何特性的概率推理和统计学习研究

论文摘要

概率推理与统计学习是从数据中发掘客观事物之间关联和内在联系的重要工具,是一个具有挑战性与诸多困难的研究领域。本文对概率推理和统计学习的关键技术进行了深入探讨,以几何方法描述数据的几何特性并与概率推理和统计学习方法相结合为主线和特色,研究了利用数据间几何关联性的线性和支持向量回归方法、基于检测时间序列几何结构的变结构动态贝叶斯网络自适应学习、基于几何模式相关的动态贝叶斯网络、以及基于两聚类几何模型的聚类数目估计问题。本文工作的主要贡献总结如下:1.针对目前线性回归和支持向量回归方法尚未关注挖掘和利用单个变量的数据关联性的问题,提出了几何关联学习方法(GcLearn)以利用这种关联性提高回归模型的预测性能。几何关联学习方法预测性能的理论分析表明,该方法具有比传统的线性回归和支持向量回归方法更好的预测性能,并给出了该方法的适用条件和判别准则。实验结果也验证了几何关联学习方法的有效性。该方法主要的创新点包括:提出挖掘单个变量的数据之间几何关联的方法、在曲线水平的几何回归方法和利用几何关联的回归模型预测方法。2.提出了通过检测时间序列的几何结构来自适应学习变结构动态贝叶斯网络的方法(autoDBN),较好解决了从多变量时间序列数据中寻找较准确的模型区域和学习较准确的变结构动态贝叶斯网络的问题,并且求得的一系列模型自适应于多变量时间序列之间的变化依赖关系。该方法克服了现有方法无专门机制寻找模型区域和盲目搜索的弱点,实验结果表明其性能明显优于现有方法。具体的创新点包括:设计了时间序列转换为曲线流形的方法,提出了描述和检测时间序列几何结构的方法来分割时间序列;进而设计了确定合理模型区域的寻找策略;最后,提出了基于竞争F-检验的模型回访机制修正求得的一系列模型区域和动态贝叶斯网络模型的可能错误。3.为了发现不同基因的表达水平在变化趋势上相关的基因调控关系,提出了基于几何模式相关的动态贝叶斯网络方法(Gp-DBN)。该方法较好地解决了基于趋势相关的基因调控关系的发现问题。真实基因表达数据的实验结果验证了该方法的有效性。该方法主要的创新点包括:提出的将基因表达的时间序列转换为几何模式的方法可以描述基因表达水平随时间上升与下降的变化趋势,用几何模式上的切向量表示几何模式特征的方法来有效地获取几何模式的离散特征量、确定调控子和估计调控时滞。4.针对在使用PAM聚类算法的基因表达数据聚类分析中现有估计类数方法在聚类结构比较复杂的情况(例如小聚类靠近大聚类和聚类间有轻微重叠)下效果不佳的问题,提出了基于两聚类几何模型的系统演化方法这一类数估计方法。系统演化方法较好地解决了在基因表达数据的聚类分析中当小聚类靠近大聚类和聚类间有轻微重叠情况时的类数估计问题。实验结果表明,系统演化方法在估计聚类数目的准确性上明显优于现有方法。系统演化方法通过分析所有潜在聚类中最靠近的两个聚类(孪生聚类)是否可分来完成对整个聚类结构的分析,并提出了两聚类的几何模型用于分析孪生聚类的可分性。同时,该方法将一个数据集视为伪热力学系统,提出了依据孪生聚类之间能量关系的系统演化规则确定最优聚类数目。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 概率推理和统计学习的研究背景及意义
  • 1.1.1 概率推理和统计学习是发掘事物内在联系的工具
  • 1.1.2 概率推理和统计学习中的关键技术
  • 1.1.3 几何方法在概率推理和统计学习中的作用
  • 1.2 概率推理和统计学习的关键技术研究现状
  • 1.2.1 统计回归分析
  • 1.2.2 动态贝叶斯网络
  • 1.2.3 聚类数目估计
  • 1.3 本文的研究内容、方法与主要成果
  • 第二章 挖掘数据间几何关联的几何关联学习
  • 2.1 引言
  • 2.2 数据之间几何关联的挖掘
  • 2.3 曲线流形之间的几何回归
  • 2.4 最优回归模型
  • 2.5 基于几何关联的回归模型预测
  • 2.6 几何关联学习的预测性能
  • 2.7 实验结果
  • 2.8 本章小结
  • 第三章 基于几何模式相关的动态贝叶斯网络
  • 3.1 引言
  • 3.2 时间序列映射为几何模式
  • 3.3 几何模式的特征、调控子和调控时滞
  • 3.4 动态贝叶斯网络推理基因调控网络
  • 3.5 实验结果
  • 3.6 本章小结
  • 第四章 变结构动态贝叶斯网络的自适应学习
  • 4.1 引言
  • 4.2 时间序列的几何结构与分割
  • 4.2.1 时间序列映射为曲线流形
  • 4.2.2 几何结构的描述与时间序列的分割
  • 4.3 合理模型区域的寻找策略
  • 4.4 动态贝叶斯网络的结构学习
  • 4.5 动态贝叶斯网络模型的回访机制
  • 4.6 自适应学习方法中的参数
  • 4.7 实验结果
  • 4.8 本章小结
  • 第五章 基于两聚类几何模型的聚类数目估计
  • 5.1 引言
  • 5.2 两聚类的几何模型
  • 5.3 分析最优聚类结构的演化原理
  • 5.4 基于两聚类几何模型的系统能量和行为
  • 5.5 系统的状态和演化规则
  • 5.6 实验结果
  • 5.7 系统演化方法的适用性
  • 5.8 本章小结
  • 第六章 总结与展望
  • 致谢
  • 参考文献
  • 攻读博士学位期间完成的论文和科研工作
  • 相关论文文献

    • [1].有效利用综合实践——稳步提升概率推理能力[J]. 考试与评价 2019(07)
    • [2].基于论据系统的带权定性概率推理机[J]. 计算机应用 2010(04)
    • [3].浅析贝叶斯公式及其在概率推理中的应用[J]. 科技创新导报 2010(24)
    • [4].概率推理系统与证据理论对应方法的改进[J]. 应用数学学报 2013(04)
    • [5].幼儿概率推理水平及源自教育的可能影响研究[J]. 教育与教学研究 2011(12)
    • [6].基于概率推理模型的博客倾向性检索研究[J]. 计算机研究与发展 2009(09)
    • [7].基于概率推理的起源过滤安全评估模型[J]. 陕西科技大学学报 2019(02)
    • [8].基于多元概率推理模型的中文书写纹识别[J]. 计算机工程 2013(11)
    • [9].基于概率推理和决策树的教学系统的设计与实现[J]. 计算机应用与软件 2009(12)
    • [10].推理教学要注意三个方面[J]. 课程教材教学研究(中教研究) 2014(Z4)
    • [11].人工智能与事实认定[J]. 法学研究 2020(01)
    • [12].贝叶斯推理及其个体发生:内涵与证据[J]. 绍兴文理学院学报(教育版) 2020(01)
    • [13].决策形式背景下的主观贝叶斯概率推理[J]. 智能系统学报 2014(02)
    • [14].关系马尔可夫网综述[J]. 计算机科学 2008(11)
    • [15].基于概率论和模糊数学的汽车故障诊断模型[J]. 湖南文理学院学报(自然科学版) 2009(02)
    • [16].书讯[J]. 火力与指挥控制 2011(08)
    • [17].一种计算逻辑结果支持度的新方法[J]. 计算机工程与应用 2012(30)
    • [18].贝叶斯推理的认知特征及其影响因素[J]. 才智 2012(05)
    • [19].贝叶斯分类算法在大学选修课成绩评估中的应用[J]. 科技经济导刊 2017(06)
    • [20].不确定性推理方法研究[J]. 火力与指挥控制 2010(11)
    • [21].概率联系数化的原理及其在概率推理中的应用[J]. 智能系统学报 2012(03)
    • [22].概率逻辑结果支持度的合成算法[J]. 微型机与应用 2011(07)
    • [23].基于模糊数学和概率论的变压器故障诊断[J]. 高电压技术 2008(05)
    • [24].数学焦虑对初中生概率推理的影响——一个有调节的中介模型[J]. 数学教育学报 2020(04)
    • [25].基于概率素养的数学教材设计特征的分析与启示——以美国CPMP教科书为例[J]. 外国中小学教育 2019(03)
    • [26].基于概率推理的不确定性任务分配评价方法[J]. 计算机工程 2015(02)
    • [27].量级模型的量性判断和推理机制[J]. 文教资料 2011(15)
    • [28].基于信念网络的岩爆倾向性预测模型研究[J]. 矿业安全与环保 2018(03)
    • [29].基于故障树贝叶斯网络的装备故障诊断方法研究[J]. 舰船电子工程 2012(06)
    • [30].动态故障诊断中的立体因果建模与不确定性推理方法[J]. 清华大学学报(自然科学版) 2018(07)

    标签:;  ;  ;  ;  ;  ;  ;  

    基于数据几何特性的概率推理和统计学习研究
    下载Doc文档

    猜你喜欢