代谢组学数据挖掘关键问题研究

代谢组学数据挖掘关键问题研究

论文摘要

代谢组学是上世纪七八十年代发展起来的一门科学,是继基因组学、转录组学、蛋白质组学之后诞生的一门新的交叉学科,也是系统生物学中的一个重要组成部分,近年来已经迅速成为生命科学研究的热点之一。与各种组学类似,代谢组学也是一门融合分析化学、化学计量学以及生理病理学等领域知识的交叉学科。完整的代谢组学研究过程包括样品的采集、预处理、数据的采集和数据的分析及解释等步骤。研究平台主要由分析技术平台和数据分析平台构成。数据分析是代谢组学研究的重要组成部分,也是揭示生物规律的关键步骤。分析技术精密性的提高,各种分析平台视窗的扩大,批量生物样本检测需求都大大增加了输出数据的量和复杂度,给后续分析和挖掘带来了极大的负担。本论文就代谢组学数据挖掘领域的几个关键问题进行研究讨论,主要内容如下:1、基于MATLAB平台,将四种分类器,偏最小二乘(Partial LeastSquares regression,PLS),线性判别式分析(Linear discriminantanalysis,LDA),支持向量机(Support vector machines,SVM)以及随机森林(Random forest,RF)应用于肠癌和肝癌临床样本集分析。通过多种评价手段评估模型的准确率,预测能力,稳定性以及过适应性,通过变量初步筛选来考察模型对于变量初筛的依赖性,以及各个模型对变量重要性排序的一致性等。2、采用机器学习方法和单维统计方法分析代谢组学实验方法学数据,筛选出最佳实验条件。两组实验方法学数据集,分别为血清样本沉蛋白试剂的优化实验以及衍生化的超声条件的优化实验。3、基于matlab平台,完成了两个带有用户图形界面的代谢组学数据分析软件的开发。一个是代谢组学多维统计软件。该软件集成了三种预处理方法、四种分类器和多种模型评价方法。模型评价方法包括互验证、受试者工作特征曲线和指导变量互换。软件界面友好,操作简便,为代谢组学的数据分析提供了很好的工具。另一个是标曲拟合和样本批量定量软件。该软件利用高通量仪器对不同浓度化合物进行检测得到的强度信息,可自动建立化合物浓度标准曲线并应用该曲线对样本中各物质的浓度进行定量,替代科研和技术人员重复性高且耗时耗力的逐一定量操作,提高工作效率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 前言
  • 1.1. 代谢组学简介
  • 1.1.1. 代谢组学概念及研究现状
  • 1.1.2. 代谢组学研究一般流程
  • 1.2. 代谢组学数据挖掘
  • 1.2.1. 代谢组学数据特征
  • 1.2.2. 代谢组学数据预处理
  • 1.2.3. 代谢组学数据统计分析
  • 1.2.4. 数据定量
  • 1.3. 本文研究内容
  • 第二章 典型机器学习算法在代谢组学数据分析中的应用和比较
  • 2.1. 引言
  • 2.2. 典型方法介绍
  • 2.2.1. 偏最小二乘(PLS)
  • 2.2.2. 线性判别分析(LDA)
  • 2.2.3. 支持向量机(SVM)
  • 2.2.4. 随机森林(RF)
  • 2.3. 模型评估方法
  • 2.3.1. 交叉验证
  • 2.3.2. 指导变量置换(Permutation)
  • 2.3.3. 受试者工作特征曲线(ROC)
  • 2.3.4. 对特征筛选的依赖性(Variable selection)
  • 2.3.5. 变量评价的一致性
  • 2.4. 应用
  • 2.4.1. 数据集
  • 2.4.2. 结果及讨论
  • 2.5. 软件开发
  • 2.5.1. 功能简介
  • 2.5.2. 基本流程图
  • 2.5.3. 界面和操作
  • 2.6. 本章小结
  • 第三章 代谢组学实验方法学数据分析
  • 3.1. 引言
  • 3.2. 方法
  • 3.3. 沉蛋白试剂优化
  • 3.3.1. 数据集
  • 3.3.2. 沉蛋白试剂筛选
  • 3.3.3. 沉蛋白试剂与血清的配比筛选
  • 3.3.4. 沉蛋白试剂的配比筛选
  • 3.4. 衍生化条件优化
  • 3.4.1. 数据集
  • 3.4.2. 衍生化温度(Derivatization temperature)
  • 3.4.3. 反应时间(Reaction time)
  • 3.4.4. 衍生试剂体积(BSTFA+1%TMS)
  • 3.4.5. 已鉴定物质建模验证
  • 3.5. 本章小结
  • 第四章 代谢组学据批量定量软件的开发
  • 4.1. 引言
  • 4.2. 功能简介
  • 4.3. 流程设计
  • 4.4. 界面
  • 4.5. 本章小结
  • 第五章 全文总结
  • 5.1. 研究工作总结
  • 5.2. 研究展望
  • 参考文献
  • 符号与标记(附录 1)
  • 致谢
  • 攻读硕士学位期间主要研究成果
  • 学位论文答辩决议书
  • 相关论文文献

    • [1].微生物代谢组学研究应用进展[J]. 科技风 2016(19)
    • [2].新知[J]. 37°女人 2017(04)
    • [3].代谢组学在乳酸菌研究中的应用[J]. 天然产物研究与开发 2019(08)
    • [4].代谢组学法在中药方剂中的应用概况[J]. 湖南中医杂志 2018(05)
    • [5].动态代谢组学数据分析方法介绍[J]. 中国卫生统计 2016(06)
    • [6].营养代谢组学[J]. 营养健康新观察 2012(01)
    • [7].代谢组学及其在肿瘤生物学研究中的应用进展[J]. 世界华人消化杂志 2008(34)
    • [8].代谢组学在儿童肥胖研究中的应用研究进展[J]. 中国妇幼保健 2017(22)
    • [9].临床代谢组学及其应用[J]. 实用医院临床杂志 2015(06)
    • [10].代谢组学及其在养羊业中的应用前景[J]. 中国草食动物科学 2012(S1)
    • [11].正在蓬勃兴起的“代谢组学”研究技术与方法[J]. 生命的化学 2014(01)
    • [12].基于色谱-质谱联用技术的营养代谢组学发展中的障碍及其解决办法[J]. 营养健康新观察 2012(01)
    • [13].代谢组学在药学中的应用[J]. 黑龙江医药 2011(02)
    • [14].代谢组学在儿科重病领域的研究进展[J]. 中华妇幼临床医学杂志(电子版) 2010(06)
    • [15].唾液代谢组学在流行性腮腺炎和急性化脓性腮腺炎中的初步分析[J]. 口腔颌面外科杂志 2020(03)
    • [16].基于动态代谢组学数据通路信息校正的混合效应模型建立及模拟研究[J]. 中国卫生统计 2020(05)
    • [17].代谢组学在慢性肾脏病研究中的应用进展[J]. 中国中西医结合肾病杂志 2018(04)
    • [18].代谢组学在肾脏病中西医诊疗中的应用进展[J]. 华中科技大学学报(医学版) 2018(05)
    • [19].细胞代谢组学及其应用[J]. 中国临床药理学与治疗学 2014(03)
    • [20].代谢组学国际合作交流研讨班[J]. 中药药理与临床 2009(03)
    • [21].代谢组学及其在中药体内研究中的应用[J]. 中国中西医结合肾病杂志 2008(10)
    • [22].杜仲对动脉粥样硬化小鼠血液代谢组学的影响[J]. 中国中西医结合杂志 2020(07)
    • [23].代谢组学在便秘诊疗中的作用[J]. 世界最新医学信息文摘 2018(A5)
    • [24].抗生素相关性腹泻的代谢组学[J]. 临床与病理杂志 2019(07)
    • [25].代谢组学在哺乳动物睾丸功能研究中的进展[J]. 中国兽医学报 2019(07)
    • [26].代谢组学在中西医肾脏病领域的研究进展[J]. 中国中西医结合肾病杂志 2015(08)
    • [27].药物代谢组学及其应用[J]. 中国临床药理学杂志 2014(04)
    • [28].基于核磁共振的代谢组学及其在临床应用中的研究进展[J]. 贵州医药 2010(12)
    • [29].肿瘤代谢组学的研究进展[J]. 医学研究杂志 2008(12)
    • [30].代谢组学双边研讨[J]. 国际学术动态 2016(06)

    标签:;  ;  ;  ;  

    代谢组学数据挖掘关键问题研究
    下载Doc文档

    猜你喜欢