基于高斯混合模型的基因表达组织特异性研究

基于高斯混合模型的基因表达组织特异性研究

论文摘要

组织特异性基因(TS基因)被认为是在不同的组织内表达水平差异较大、从事细胞特异性活动或者进化过程中变化较快的基因。为了分析基因表达组织特异性的因素,研究人员对基因序列模式、结构特征、调控因子特性等方面进行了相关研究。我们认为基因的表达模式是基因表达组织特异性的又一因素。研究基因的表达模式对理解生物体的内在活动机制、有针对性的疾病诊断和药物设计具有重要的作用。为此,本文提出基于高斯混合模型的方法研究基因表达的组织特异性。该研究方法主要包括三方面内容:基因表达组织特异性模式的发现、基因表达组织特异性模式的分析和组织特异性基因的预测。在基因表达组织特异性模式发现过程中,我们将基于高斯混合模型的聚类算法作为研究方法,发现模式特征。选用这种算法是因为该算法是基于概率的聚类,更适合于异质数据的集成。同时,混合模型的分量描述,更适合于寻找聚类簇与各组织之间的隐含关系。基因表达组织特异性模式分析过程,主要利用基于高斯混合模型的聚类算法聚类,分析实验数据,获取基因表达组织特异性模式的模式特征。该过程使用Affymetrix公司提供的U133A芯片基因跨组织表达数据作为实验数据,使用EST、TIGER、CFATS数据作为是实验结果的比对数据来分析聚类结果,评价基因表达组织特异性模式的性能,最终提取出基因表达组织特异性模式的参数特征。实验结果发现了对胎盘、胰腺/结肠和肾/肝等组织特异性表达的基因表达模式。组织特异性基因预测过程,主要利用模式分析过程提取的模式特征建立预测模型,预测潜在TS基因。该过程使用Affymetrix公司提供的GNF1H芯片和U133A+GNF1H芯片集基因跨组织表达数据作为实验数据,使用EST、TIGER作为实验结果的比对数据,评价基因预测的性能。结果表明预测模型对胎盘、胰腺/结肠和肾/肝组织潜在TS基因的预测性能较优,而对其他组织潜在TS基因的预测性能有待提高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 基因数据研究现状分析
  • 1.2.1 基因表达组织特异性的研究现状
  • 1.2.2 基于基因数据的聚类分析研究现状
  • 1.3 论文研究内容及主要工作
  • 1.4 论文结构安排
  • 第二章 组织特异性研究综述
  • 2.1 生物序列模式
  • 2.2 调控网络
  • 2.3 调控因子
  • 第三章 基因表达组织特异性研究总体架构
  • 3.1 基因表达组织特异性研究架构
  • 3.2 基因表达组织特异性模式发现
  • 3.3 基因表达组织特异性模式分析
  • 3.3.1 实验数据预处理
  • 3.3.2 模式性能评价
  • 3.3.3 模式特征提取
  • 3.4 组织特异性基因预测
  • 3.4.1 预测模型建立
  • 3.4.2 潜在TS基因预测
  • 3.4.3 预测结果分析
  • 3.5 总结
  • 第四章 运用基于高斯混合模型的聚类算法发现基因表达组织特异性模式
  • 4.1 使用基于高斯混合模型的聚类算法的缘由
  • 4.2 基于高斯混合模型的聚类算法描述
  • 4.2.1 高斯混合模型
  • 4.2.2 共轭先验理论
  • 4.2.3 算法框架
  • 4.2.4 参数估计
  • 4.3 针对先验知识改进的聚类算法
  • 4.3.1 KMEANS算法先验分析
  • 4.3.2 简单高斯混合模型先验分析
  • 4.4 基因表达组织特异性发现过程总结
  • 第五章 基因表达组织特异性模式分析
  • 5.1 实验使用的数据
  • 5.2 实验数据预处理
  • 5.2.1 数据降噪处理
  • 5.2.2 对数处理
  • 5.2.3 阈值处理
  • 5.2.4 组织类别提取
  • 5.3 实验参数设定
  • 5.4 评价指标介绍
  • 5.4.1 敏感性、特异性、准确度和相关系数
  • 5.4.2 micro-p指标
  • 5.5 实验结果简要说明
  • 5.6 基因表达组织特异性模式分析
  • 5.6.1 EST数据介绍
  • 5.6.2 以EST数据为比对数据的性能分析
  • 5.6.3 以其他数据为比对数据的性能分析
  • 5.7 基因表达组织特异性模式确定
  • 5.7.1 表达具有组织特异性模式的聚类簇获取
  • 5.7.2 基因表达组织特异性模式特征确定
  • 5.8 改进的聚类算法对基因表达组织特异性模式分析
  • 5.9 模式分析总结
  • 第六章 组织特异性基因预测
  • 6.1 预测组织特异性基因模型
  • 6.2 预测结果分析
  • 6.2.1 预测组织特异性基因的组织范围
  • 6.2.2 预测结果分析
  • 6.3 预测结果总结
  • 第七章 总结与展望
  • 参考文献
  • 附录
  • 致谢
  • 相关论文文献

    • [1].植物组织特异性基因表达技术及其应用[J]. 植物生理学报 2015(06)
    • [2].肝组织特异性基因启动子靶向干预肝纤维化的研究现状[J]. 国际消化病杂志 2011(02)
    • [3].GATA4在肿瘤中的研究进展[J]. 实用癌症杂志 2013(02)
    • [4].棕色脂肪组织特异性基因在抵抗肥胖中作用的研究[J]. 临床消化病杂志 2013(01)
    • [5].肺组织特异性基因HIMF的克隆及其真核表达载体的构建[J]. 华中科技大学学报(医学版) 2008(04)
    • [6].一种新型肿瘤组织起源分子标志物的建立与评价[J]. 中国癌症杂志 2016(10)
    • [7].外周血LUNX mRNA与围手术期肺癌微转移相关性的临床研究[J]. 新医学 2015(02)

    标签:;  ;  ;  ;  

    基于高斯混合模型的基因表达组织特异性研究
    下载Doc文档

    猜你喜欢