缺失数据对参数估计EM算法影响的实验研究

缺失数据对参数估计EM算法影响的实验研究

论文摘要

在社会调查资料中,数据缺失是一种常见现象,甚至是无法避免的。造成数据缺失的原因有很多,比如失访、无响应或是回答问题不合格等等。统计学上,将含有缺失数据的记录称为不完全观测。缺失数据或不完全观测对调查研究的结果有很大的影响。如何使用不完全数据来进行研究分析这一问题从很早就开始了研究,EM(Expectation-Maximization期望最大)算法就是这样一个研究成果。EM算法是一种求参数极大似然估计的迭代算法,在处理不完全数据中有重要应用。它的最大优点是实现简单;数值计算稳定;存储量小;特别是,每一次迭代能保证观察数据对数似然函数是单调不减的。其主要的思想是:先假设缺失和隐含数据的初始值,然后估计模型的参数,再利用模型参数值来估计缺失和隐含数据值,根据估计出的缺失和隐含数据值再对参数值进行更新,如此反复迭代。EM算法主要应用于下面两种非完全数据参数估计:第一,观测数据不完全,这是由于观测过程的局限性所导致;第二,似然函数不是解析的或者似然函数的解析式过于复杂从而导致极大似然函数的传统估计方法失效。由于EM算法的优点,EM算法被广泛的用于对缺失数据的处理和基于EM算法的含缺失数据的参数估计。本文针对EM算法对于缺失数据的估计问题进行了几点研究:(1)缺失率的不同对EM算法是否存在影响,如果存在,是怎样的影响;(2)EM算法对于初始值的灵敏度分析;(3)在极大似然估计中,增大观测值的数量能有效的提高参数估计的精度,这个结论在EM算法中是否适用,如果不适用,EM算法对于观测数据的数量存在什么样的要求。从以上三点出发,使用计算机模拟实验得到了一些结论,并通过实际案例对结论进行了验证。

论文目录

  • 摘要
  • Abstract
  • 1 引言
  • 1.1 论文选题背景及意义
  • 1.2 国内外研究综述
  • 1.2.1 缺失数据研究综述
  • 1.2.2 EM 算法研究综述
  • 1.3 数据生成方式及结果评价
  • 1.4 本文所作的工作
  • 2 指数分布与正态分布的 EM 参数估计
  • 2.1 极大似然估计
  • 2.2 EM 算法及其性质
  • 2.2.1 EM 算法
  • 2.2.2 EM 算法的性质
  • 2.3 常用分布下 EM 算法的参数估计
  • 2.3.1 指数分布的 EM 参数估计
  • 2.3.2 正态分布的 EM 算法参数估计
  • 3 模拟分析
  • 3.1 实验步骤设计
  • 3.2 指数分布下 EM 算法的模拟分析
  • 3.2.1 不同的缺失率对指数分布 EM 参数估计的影响
  • 3.2.2 不同的初始值对指数分布 EM 参数估计的影响
  • 3.2.3 观测值数量对指数分布 EM 参数估计的影响
  • 3.3 正态分布下 EM 算法的模拟分析
  • 3.3.1 不同的缺失率对正态分布 EM 参数估计的影响
  • 3.3.2 不同的初始值对正态分布 EM 参数估计的影响
  • 3.3.3 观测值数量对正态分布 EM 参数估计的影响
  • 3.3.4 实例验证
  • 4 结论及进一步的工作
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 附录
  • 附录 1:对数正态分布实例数据
  • 致谢
  • 相关论文文献

    • [1].基于EM算法的混合模型中子总体个数的研究[J]. 数理统计与管理 2020(01)
    • [2].EM菌在水产养殖中的应用概述[J]. 中国农学通报 2020(11)
    • [3].EM菌对小鼠肠道病变的修复作用[J]. 养殖与饲料 2020(02)
    • [4].低温条件下EM菌液体发酵试验研究[J]. 今日畜牧兽医 2020(07)
    • [5].超声电机的EM核鲁棒建模研究[J]. 电气传动 2020(07)
    • [6].EM技术对辣椒果实性状和产量的影响[J]. 上海蔬菜 2017(01)
    • [7].EM菌在有机固体废弃物堆肥中的应用[J]. 仲恺农业工程学院学报 2017(01)
    • [8].EM患者血清与腹腔液中CA125的表达与意义[J]. 中国城乡企业卫生 2015(06)
    • [9].对东北某垃圾堆场利用EM菌加速稳定化的研究[J]. 哈尔滨商业大学学报(自然科学版) 2016(06)
    • [10].EM菌在畜禽养殖中的应用[J]. 养殖与饲料 2016(05)
    • [11].基于EM算法的青霉素发酵过程多阶段融合建模[J]. 化工学报 2014(12)
    • [12].低聚壳聚糖在EM菌液中的溶解及体系稳定性研究[J]. 安徽农业科学 2012(07)
    • [13].低聚壳聚糖在EM菌液中的溶解及体系稳定性研究(英文)[J]. Agricultural Science & Technology 2012(03)
    • [14].鸡白痢的诊治及EM技术试验[J]. 安徽农学通报(下半月刊) 2011(14)
    • [15].EM菌液在甲鱼养殖中的应用效果研究[J]. 现代农业科技 2011(15)
    • [16].EM在鸡腿菇栽培上的初探[J]. 广西轻工业 2008(12)
    • [17].基于EM算法的高斯混合模型参数估计[J]. 黔南民族师范学院学报 2020(04)
    • [18].有效微生物(EM)在水产养殖中的应用及机理[J]. 净水技术 2014(06)
    • [19].一种基于高斯混合模型的改进EM算法研究[J]. 应用光学 2013(06)
    • [20].双极型晶体管EM大信号模型参数提取方法探讨[J]. 实验室研究与探索 2014(08)
    • [21].EM生物膜强化处理垃圾渗滤液[J]. 环境工程学报 2013(01)
    • [22].EM对嗜水气单胞菌体外抑制作用试验[J]. 江西农业大学学报 2013(02)
    • [23].不同配方EM菌对规模化养殖刺参生长和存活的影响[J]. 现代农业科技 2013(11)
    • [24].基于EM算法的改进OFDM时变信道估计[J]. 通信技术 2011(01)
    • [25].基于EM的朴素贝叶斯分类算法[J]. 宿州学院学报 2010(11)
    • [26].改进的EM算法在说话人识别中的应用[J]. 辽宁工业大学学报(自然科学版) 2009(03)
    • [27].EM对锦鲤生长的影响[J]. 浙江海洋学院学报(自然科学版) 2009(02)
    • [28].生物炭和EM菌对黄河三角洲盐碱地田菁生长和光合特性的影响[J]. 应用生态学报 2020(09)
    • [29].腹腔镜联合药物治疗子宫内膜异位症(EM)合并不孕的临床价值研究[J]. 当代医学 2016(04)
    • [30].EM菌对连作大蒜形态和生理生化指标的影响[J]. 江苏农业科学 2016(02)

    标签:;  ;  ;  ;  ;  

    缺失数据对参数估计EM算法影响的实验研究
    下载Doc文档

    猜你喜欢