基因芯片设计与数据处理中的若干关键问题研究

基因芯片设计与数据处理中的若干关键问题研究

论文摘要

基因芯片技术的应用给现代生物学研究带来了巨大的变革。其出现和发展是多学科交叉的结果,其中一些关键问题的解决强烈依赖于生物信息学研究的支持,特别是基因芯片设计和数据分析问题。围绕基因芯片设计和数据分析问题,本文重点研究了:大规模细菌检测16S rRNA基因芯片探针设计和基因芯片表达谱数据分析。探索微生态系统中的生物多样性是元基因组学研究的重要内容,面对未知环境样本,快速准确地鉴定其中细菌的种系构成,研究细菌的广谱检测方法具有十分重要的应用价值,这项技术在复杂微生物菌落分析、微生物环境监控等领域具有广阔的应用前景。随着16S rRNA序列资源的不断丰富,以及寡核苷酸微阵列基因芯片技术的不断进步,设计大规模细菌检测16S rRNA基因芯片,分析未知环境样本中的微生物种群的种系构成成为可能。大规模细菌检测16S rRNA基因芯片设计问题的关键是探针的优化设计,首先,探针优化设计的基础是对寡核苷酸杂交行为的准确预测。采用计算的方法分析核酸分子在溶液中杂交反应的热力学性质具有很好的效果,然而,当杂交产生的双链体中有一个单链核酸分子一端固连于芯片表面时,这种复杂的固连效应会对探针捕获目标核酸分子过程的动力学和热力学分析产生较大的影响,降低了预测杂交稳定性的准确性。通过对大量杂交实验数据的统计分析,我们发现将完全匹配(perfect match,PM)探针和相应的错配(mismatch,MM)探针的杂交结合自由能相减,能在一定程度上消除这种固连效应对计算预测的负面影响。因此,针对每个探针设计阳性对照点能有效提高基因芯片对特异性和非特异性杂交的分辨能力。在设计大规模细菌检测16S rRNA基因芯片的过程中,所有的目标序列依据细菌分类学划分为多组。在一个分类单元中存在多种16S rRNA基因的拷贝,这就需要针对每个分类单元设计组特异性探针。已有的组特异性探针设计方法大都是基于全局序列对齐的,计算复杂度较高。本文设计了一种OligoSampling算法,使用MCMC方法进行组特异性探针设计。该方法不需要首先将序列全局对齐,而且具有更高的效率和灵活性。能够针对细菌分类单元设计组特异性探针,还不足以解决大规模细菌检测16S rRNA基因芯片设计问题。对于依据细菌分类学定义的一组16S rRNA序列,组内的目标序列相似但不完全相同,设计单个组特异性探针检测组内所有目标序列是很困难的。因此,本文进一步研究了设计多个探针通过组合方式进行细菌检测。每个探针能够特异性地检测组内一部分目标序列,通过组合(各个探针按照逻辑“或”的方式进行组合,任何一个探针检测出阳性信号即表示检测到目标菌种)就能够提高覆盖率。面对探针组合优化问题,本文提出了一个可行的基于相对熵和遗传算法的组合探针设计算法。将上述方法应用于大规模16S rRNA细菌检测基因芯片设计,结果表明设计的组特异性探针组具有很高的特异性和很低的交叉杂交发生率。针对某个菌种设计特异性探针组时,如果在进化过程中,其他不相干的菌株发生了多碱基突变,就可能与探针组中某个探针发生特异性杂交,这将对检测结果产生干扰。但是,组外的菌株在16S rRNA的多个位点上都通过多碱基突变而与多个组特异性探针均发生交叉杂交的可能性极小。基于以上事实,本文还研究了着眼于提高检测特异性的检测策略,即将多个探针按照逻辑“与”的方式组合(所有的探针都检测出阳性信号即表示检测到目标菌种)。我们首先使用OligoSampling算法设计组特异性候选探针,然后将多个候选探针按照逻辑“与”的方式组合成一个检测单元,再将多个检测单元按照逻辑“或”的方式组合起来检测目标菌种。结果表明,按照这种方式组合探针,也能够在保证特异性的基础上获得很高的覆盖度。一般的表达谱基因芯片数据处理方法包含两个步骤:标准化和差异表达基因识别。差异表达基因的存在,特别地,当上调的差异表达基因与下调的差异表达基因在数量上存在较大差别时,这会对标准化的准确性产生负面影响。而标准化的结果又会影响到差异表达基因的识别。对于一个两步过程——差异表达基因识别和标准化,无论哪一个先做,都会将误差累计到下一步。本文提出了一种新的基于迭代重选择算法的野点剔除方法,并将其应用于表达谱数据标准化。仿真和真实数据的分析结果表明,本文提出的方法能够在一个迭代过程中,逐步消除野点的影响,有效地提高表达谱数据标准化的准确性,并同时准确地识别差异表达候选基因。将该方法应用于啤酒酵母氨基酸缺乏培养表达谱数据,本文发现了与原始论文不一样的生物学结论,在参与碳水化合物代谢过程的基因中,同化酶的诱导先于异化酶的诱导,而不是两种酶同时诱导。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 核酸微阵列芯片技术与应用概述
  • 1.2.1 核酸微阵列芯片的分类
  • 1.2.2 核酸微阵列芯片的工作原理
  • 1.2.3 表达谱基因芯片
  • 1.2.4 检测型基因芯片
  • 1.2.5 基于基因芯片技术的崭新生物学研究模式
  • 1.2.6 基因芯片数据分析与处理概述
  • 1.3 论文的研究内容、主要贡献和组织结构
  • 1.3.1 论文的研究内容
  • 1.3.2 论文的主要贡献
  • 1.3.3 论文的组织结构
  • 第二章 寡核苷酸基因芯片杂交动力学分析
  • 2.1 通过序列构成预测双链DNA稳定性
  • 2.1.1 计算预测完全匹配的双链DNA的稳定性
  • 2.1.2 存在错配的情况下计算预测双链DNA的稳定性
  • 2.2 寡核苷酸探针热力学特性的计算预测方法
  • 2.2.1 杂交反应中寡核苷酸探针和目标核酸分子折叠结构分析
  • 2.2.2 计算预测自由能与杂交反应荧光强度的相关性分析
  • 第三章 寡核苷酸探针设计方法研究
  • 3.1 序列特异性寡核苷酸探针设计方法概述
  • 3.2 基于全局多序列对齐的组特异性寡核苷酸探针设计方法概述
  • 3.3 基于MCMC方法的组特异性寡核苷酸探针设计方法
  • 3.3.1 方法描述
  • 3.3.2 应用实例
  • 3.3.3 讨论
  • 第四章 基于组合探针识别的大规模细菌分类165 rRNA基因芯片设计方法研究
  • 4.1 细菌分子生物学检测方法概述
  • 4.2 大规模16S rRNA细菌检测基因芯片设计中的关键问题
  • 4.3 基于相对熵和遗传算法的165 rRNA细菌检测基因芯片设计方法
  • 4.3.1 方法描述
  • 4.3.2 应用实例
  • 4.3.3 讨论
  • 第五章 基于组合逻辑判别的细菌鉴定16S rRNA基因芯片设计方法研究
  • 5.1 细菌鉴定技术概述
  • 5.2 方法描述
  • 5.3 应用实例
  • 5.4 讨论
  • 第六章 表达谱基因芯片数据标准化方法研究
  • 6.1 表达谱基因芯片数据分析方法概述
  • 6.2 一种新的野点剔除方法在表达谱基因芯片数据标准化中的应用
  • 6.2.1 方法描述
  • 6.2.2 仿真分析
  • 6.2.3 应用实例
  • 6.2.4 讨论
  • 第七章 总结与展望
  • 7.1 论文工作总结
  • 7.2 未来工作展望
  • 致谢
  • 参考文献
  • 作者在学期间取得的学术成果
  • 附录A 997 个菌属特异性探针组
  • 附录B 迭代重选择算法伪代码
  • 相关论文文献

    • [1].基于人工表面等离激元探针实现太赫兹波的紧聚焦和场增强[J]. 物理学报 2020(05)
    • [2].基于无线探针数据的区间车速估计方法与分析[J]. 武汉理工大学学报(交通科学与工程版) 2020(02)
    • [3].三种人全外显子组捕获探针的性能比较[J]. 中华临床实验室管理电子杂志 2020(01)
    • [4].高频响气动探针研究综述[J]. 中国电机工程学报 2020(19)
    • [5].染色体核型分析与八探针间期荧光原位杂交检测急性淋巴细胞白血病儿童细胞遗传学异常[J]. 包头医学院学报 2015(11)
    • [6].真空探针冷冻和复温性能实验测试及数值模拟[J]. 化工学报 2020(04)
    • [7].一种选择性检测肼的近红外荧光增强型探针的合成[J]. 合成化学 2020(09)
    • [8].基于巨噬细胞活性成像探针的研究进展[J]. 当代化工 2020(07)
    • [9].稳态焓探针的优化设计与试验验证[J]. 实验流体力学 2020(04)
    • [10].牙周探针通用要求及试验方法的可行性研究[J]. 中国医疗器械信息 2016(21)
    • [11].扫描隧道显微镜探针的制备与修饰的方法研究[J]. 贵州大学学报(自然科学版) 2015(04)
    • [12].提高微透析探针回收率方法的研究进展[J]. 中南药学 2014(02)
    • [13].高压氩气节流型低温探针的实验研究[J]. 低温工程 2014(01)
    • [14].影响炼化装置腐蚀探针监测数据变化的几个因素[J]. 腐蚀与防护 2014(07)
    • [15].分布式网络故障监测的探针部署方法[J]. 计算机系统应用 2011(11)
    • [16].一种轮胎磨损测量装置[J]. 橡胶科技 2020(03)
    • [17].基于热扩散探针的便携式植物液流监测仪研究[J]. 农业机械学报 2020(07)
    • [18].阿魏酸、川芎嗪微透析脑探针回收率测定及影响因素研究[J]. 中国中药杂志 2015(21)
    • [19].基于拉锥结构的全光纤型内窥光学相干层析成像探针研究[J]. 物理学报 2016(02)
    • [20].基于苯并咪唑的(Ⅲ)探针的合成及其性能[J]. 武汉大学学报(理学版) 2016(01)
    • [21].探针机模型求解旅行商问题[J]. 淮北师范大学学报(自然科学版) 2016(02)
    • [22].局部腐蚀引起电感探针数据的失真[J]. 腐蚀与防护 2014(10)
    • [23].八探针间期荧光原位杂交技术联合染色体核型分析比较成人与儿童急性淋巴细胞白血病患者的细胞遗传学差异[J]. 南方医科大学学报 2012(05)
    • [24].多孔探针系统误差分析[J]. 实验流体力学 2012(05)
    • [25].半导体表面电学特性微观四点探针测试技术研究进展[J]. 真空 2011(01)
    • [26].微波共振探针优化[J]. 东华大学学报(自然科学版) 2018(01)
    • [27].叶轮机械非定常测量的快速响应熵探针[J]. 工程热物理学报 2016(01)
    • [28].多重连接探针扩增技术在临床病原体检测中的应用[J]. 中国真菌学杂志 2015(05)
    • [29].初中生物学“遗传部分”概念探针研究[J]. 中学生物学 2015(02)
    • [30].一种电探针脉冲形成电路的改进[J]. 计测技术 2013(04)

    标签:;  ;  ;  ;  ;  

    基因芯片设计与数据处理中的若干关键问题研究
    下载Doc文档

    猜你喜欢