多元校正新算法研究和二维数据分析方法在色谱分离评价中的应用

多元校正新算法研究和二维数据分析方法在色谱分离评价中的应用

论文摘要

本文作者对多元校正中的一些难点问题进行了深入的研究,提出了多种新型化学计量学算法,并将其应用于标准校正数据集的研究,另外也对化学计量学二维数据分析方法在色谱分离质量评价中的应用进行了一些研究。本论文主要包括以下几个方面的工作:1.探讨了多元校正建模中的训练集样品的代表性和最优化样品加权问题。由于多元校正的样品光谱空间的多维性和复杂性以及样品选取过程中的不确定性,准确估计训练集样品在整个样品空间的代表性尚存在一定困难。传统的多元校正模型大多根据经验方法选择代表性样品,在某些不利的情况下可能会影响校正模型对新样品的预测性能。为解决以上问题,同时考虑到样品的代表性很难通过考察单个样品进行估计,我们把全局优化样品加权的思想和偏最小二乘相结合,提出了最优化样品加权偏最小二乘这一新算法。该算法通过对原来的训练集样品进行非负加权,在校正建模过程中同时考虑了模型的复杂性和预测能力,最优样品权重通过粒子群优化算法搜索获得。另外,为了使样品加权偏最小二乘的建模和优化更加易于计算,我们进一步证明了样品加权校正模型可通过对每个样品的光谱数据和组分浓度值乘以一个相同的非负常数实现。将该算法应用于真实的标准数据集的结果表明,在原始校正样品的代表性较差时,最优化样品加权偏最小二乘算法确实能够改善模型的预测性能。2.基于粒子群优化算法,我们提出了一种较传统的变量选择方法更为灵活的变量加权方法。通过对传统的基于变量选择的校正模型的考察可以发现,进入校正模型的变量实际上被赋予权重1,而被模型舍弃的变量的权重实则为0。如果把权重的概念引入变量选择,允许变量的权重取非负的连续值,则传统的变量选择只是变量加权的一种特殊情况。另外,由于变量加权的目标是同时优化校正集的训练和验证集的预测,连续非负的变量加权实际上可视为对光谱变量的某种最优化重新刻度,因此比传统的变量选择有更多的灵活性。对真实校正数据集的研究表明,变量加权偏最小二乘方法不仅能起到变量选择的作用,还能够在校正模型中保留较多的变量,保持了多元校正的多通道优势。3.我们改进了一种新的机器学习算法—叠加回归,并将其应用于多元校正,同时实现了波长区间的快速自动优化选择和校正模型组合。我们用蒙特卡罗交互验证代替了叠加回归中的传统的交互验证,再用改进了的叠加回归算法组合建立在单个波长子区间上的偏最小二乘模型,所得模型在组合系数非负的约束下具有最小的蒙特卡罗交互验证均方根误差,所以可以期望组合模型具有较好的泛化性能和防止过拟合的能力。叠加回归能够通过非负最小二乘法确定模型组合系数,把某些光谱子区间模型对应的组合系数置为0,从而实现波长子区间的自动选择。另外,由于线性组合模型的蒙特卡罗交互验证可通过组合一系列子模型的蒙特卡罗交互验证来实现,而单个的光谱子区间模型的交互验证计算量很小,所以该方法与同类区间选择方法相比,计算量要小得多。对标准校正数据集的研究进一步证实了该方法的实用性。4.我们提出了一种多元校正中近红外光谱数据预处理的新概念—群预处理方法。由于近红外光谱数据经常受到背景、基线漂移和噪声等不利因素的影响,对原始光谱测量数据进行适当的预处理在很多情况下已经成为多元校正的必要步骤。但是,由于光谱的复杂性和先验信息的缺乏,确定最好的预处理方法常常需要多次尝试,并且要求操作者有一定的数据处理经验;另外,单一的预处理方法在改善数据的某些方面的同时,也可能带来某些方面的负面影响和面临信息丢失的风险,并且基于单一预处理方法的校正模型对新样品的预测可能缺乏稳定性。为解决以上问题,我们提出了近红外光谱的群预处理方法,该方法用蒙特卡罗交互验证叠加回归算法组合一系列基于不同预处理方法的校正模型,可以实现预处理方法的自动选择和优化加权。对真实校正数据集的研究结果表明,基于群预处理方法的校正模型与基于单一预处理方法的校正模型相比,不仅保持或改善了原有模型的准确性,而且模型的稳定性有所提高。5.我们把移动窗口偏最小二乘算法应用于多元校正的模型转移,建立了高稳定性和低复杂度的全局校正模型。当把已有的校正模型应用于新样品的光谱校正时,如果新样品的光谱含有与模型的训练样品不相同的光谱贡献时,为防止出现偏差和严重的误差,就需要对原有的校正模型进行校正转移。我们把一种新的波长区间选择方法—移动窗口偏最小二乘法引入到全局校正模型中。移动窗口偏最小二乘法能够选择与化学组分相关的光谱子区间,并且能够降低全局模型的复杂度。通过对标准的校正数据集的研究,基于移动窗口偏最小二乘的全局模型确实体现了上述优点,较好地实现了校正模型的转移。6.我们讨论了基于单通道检测器的色谱图的传统的色谱分离标准在估计色谱分离质量时可能遇到的问题,并且指出,很多问题都是由于一维色谱图在严重峰重叠的情况下缺少诸如组分数、重叠度和峰纯度等信息造成的。然后,我们综述了化学计量学二维数据分析方法在色谱分离效率评价中的应用,并且依据文献和我们的研究经验,对某些重要问题进行了讨论。7.我们提出了一种新的基于秩图的色谱分离评价指标—峰纯度加权分辨率。与传统的基于单通道信号检测器的色谱分离标准相比,峰纯度加权分辨率的优势在于它同时利用了化学组分数、重叠程度、流出时间和峰纯度等关键色谱信息,而这些信息在色谱峰严重重叠时是很难从一维色谱信号中获得的。对模拟色谱体系和一个真实色谱体系的研究表明,峰纯度加权分辨率的值能合理地反映色谱重叠程度的大小,该标准确实可用于严重重叠的色谱图的分离估计。最后,我们还讨论了使用峰纯度加权分辨率时应当注意的问题。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 多元校正
  • 1.2 色谱分离质量评价
  • 1.3 本论文的研究工作
  • 第2章 最优化样品加权偏最小二乘法
  • 2.1 前言
  • 2.2 理论
  • 2.2.1 偏最小二乘回归
  • 2.2.2 粒子群优化算法
  • 2.2.3 最优化样品加权偏最小二乘
  • 2.3 真实数据集
  • 2.3.1 肉类光谱数据
  • 2.3.2 燃料数据
  • 2.4 结果与讨论
  • 2.5 小结
  • 2.6 定理证明
  • 第3章 变量加权偏最小二乘法
  • 3.1 前言
  • 3.2 理论
  • 3.3 真实数据集
  • 3.3.1 肉类光谱数据
  • 3.3.2 近红外药片数据
  • 3.4 结果与讨论
  • 3.5 小结
  • 第4章 多元校正模型组合和快速波长区间选择:基于蒙特卡罗交互验证的叠加回归
  • 4.1 前言
  • 4.2 理论
  • 4.3 数据集
  • 4.3.1 干草数据
  • 4.3.2 柴油燃料的近红外光谱数据
  • 4.4 结果与讨论
  • 4.4.1 干草数据
  • 4.4.2 柴油燃料的近红外光谱数据
  • 4.5 小结
  • 第5章 光谱数据的群预处理方法及其在近红外光谱多元校正中的应用
  • 5.1 前言
  • 5.2 理论
  • 5.3 数据集
  • 5.3.1 麦粒数据
  • 5.3.2 肉类光谱数据
  • 5.4 结果与讨论
  • 5.4.1 麦粒数据
  • 5.4.2 肉类光谱数据
  • 5.5 小结
  • 第6章 基于移动窗口偏最小二乘的校正转移模型
  • 6.1 前言
  • 6.2 理论
  • 6.2.1 移动窗口偏最小二乘
  • 6.2.2 基于移动窗口偏最小二乘的全局模型
  • 6.3 数据集
  • 6.3.1 近红外药片数据
  • 6.3.2 不同温度下的光谱数据
  • 6.4 结果与讨论
  • 6.4.1 近红外药片数据
  • 6.4.2 不同温度下的光谱数据
  • 6.5 小结
  • 第7章 化学计量学方法在色谱分离质量评价中的应用
  • 7.1 前言
  • 7.2 化学组分数的估计
  • 7.2.1 基础知识和假设
  • 7.2.2 基于已知实验误差的组分数估计方法
  • 7.2.3 估计化学组分数的经验方法
  • 7.3 色谱流出顺序的估计
  • 7.3.1 色谱流出信息和自模式曲线分辨
  • 7.3.2 估计色谱流出顺序的化学计量学方法
  • 7.4 色谱峰纯度的估计
  • 7.5 基于化学计量学数据分析和信息提取的色谱分离标准
  • 7.6 小结
  • 第8章 一种基于化学计量学数据处理的色谱分离评价标准:峰纯度加权分辨率
  • 8.1 前言
  • 8.2 理论
  • 8.3 数据集
  • 8.4 结果与讨论
  • 8.4.1 模拟四组分体系
  • 8.4.2 真实四组分体系
  • 8.5 小结
  • 结论
  • 参考文献
  • 附录A 攻读学位期间发表及完成的论文目录
  • 致谢
  • 相关论文文献

    • [1].不同大气校正模型对叶面积指数遥感反演精度的影响比较[J]. 干旱区资源与环境 2014(07)
    • [2].抗差递推校正模型的风险分析[J]. 中国农村水利水电 2011(06)
    • [3].定量近红外光谱分析中应用自适应神经网络法建立校正模型[J]. 理化检验(化学分册) 2009(03)
    • [4].使用预测-校正模型优化网络流量预测的神经网络[J]. 计算机时代 2009(11)
    • [5].基于混合滤波和节点自适应校正模型的测距算法[J]. 传感技术学报 2016(08)
    • [6].基于分段校正模型的在线电压协调控制[J]. 电力系统自动化 2013(16)
    • [7].基于局部特性的分割校正模型改进[J]. 计算机工程 2014(08)
    • [8].无线传感器网络节点定位加权校正模型[J]. 计算机应用 2012(02)
    • [9].近红外多元校正模型传递的进展[J]. 药物分析杂志 2009(08)
    • [10].农机导航自校正模型控制方法研究[J]. 农民致富之友 2018(05)
    • [11].农机导航自校正模型控制方法探讨[J]. 时代农机 2017(08)
    • [12].自流井有限差分模拟的校正模型[J]. 地球科学(中国地质大学学报) 2008(01)
    • [13].基于微型近红外光谱仪油菜籽粗脂肪与粗蛋白校正模型的建立[J]. 安徽农业大学学报 2017(03)
    • [14].CRInSAR大气校正模型比较与分析[J]. 安徽农业科学 2014(13)
    • [15].基于谱线漂移校正模型的实验室光谱定标修正[J]. 光电工程 2012(02)
    • [16].乌醋溶液中乌洛托品含量的近红外光谱温度校正模型的研究[J]. 含能材料 2018(05)
    • [17].用多维校正法提高近红外牛奶成分校正模型稳健性的研究[J]. 光谱学与光谱分析 2009(04)
    • [18].防己药材近红外光谱快速无损检测的研究[J]. 时珍国医国药 2017(06)
    • [19].一种基于物理机理的高光谱遥感图像真彩色校正模型[J]. 遥感技术与应用 2013(03)
    • [20].压力传感器的支持向量机非线性回归建模[J]. 传感器与微系统 2012(04)
    • [21].基于高斯校正模型的MDS-MAP定位算法[J]. 电脑与信息技术 2015(03)
    • [22].基于平行因子分析法提高近红外无创血糖校正模型稳健性的研究[J]. 化学学报 2013(09)
    • [23].基于GPS的河北省冬春季节MODIS水汽校正模型研究[J]. 大地测量与地球动力学 2018(10)
    • [24].基于近红外光谱分析技术的食品包装塑料的定性分析[J]. 分析测试学报 2020(11)
    • [25].应用高斯校正模型的DV-Hop改进算法[J]. 重庆理工大学学报(自然科学) 2013(12)
    • [26].基于印前网点补偿的印版校正方法研究[J]. 包装工程 2018(23)
    • [27].近红外光谱技术在蜂蜜检测中的应用[J]. 食品工业科技 2020(12)
    • [28].增强差压测高校正模型的建立及其性能验证[J]. 信息通信 2018(12)
    • [29].多元校正模型传递方法的进展与应用[J]. 分析化学 2019(04)
    • [30].湖泊叶绿素a反演的大气校正模型比较研究[J]. 云南大学学报(自然科学版) 2014(02)

    标签:;  ;  ;  ;  ;  ;  ;  

    多元校正新算法研究和二维数据分析方法在色谱分离评价中的应用
    下载Doc文档

    猜你喜欢