基于DNA结构特性的启动子预测方法研究

基于DNA结构特性的启动子预测方法研究

论文摘要

在过去的几年中,我们已经完成了多个物种基因组的测序计划,对这些已经完整测序的基因组进行详细的注释变得越来越重要,而识别核心启动子是基因组注释中最具挑战性的工作之一。核心启动子包含了指导转录起始所必需的DNA序列,因此识别核心启动子是我们理解转录调控机制的重要方面,也是研究基因表达模式和构建基因调控网络的必要步骤。现有的识别核心启动子的实验方法价格昂贵、耗时长,而且通常不能识别没有转录活性的启动子,因此研究者开始探索使用计算机从头预测的方法在指定的基因组序列上定位启动子区域。目前已经提出了多种启动子预测方法,但是由于启动子序列变化多样,现有方法在基因组范围内的预测精度仍然不能满足要求。主要是因为现有方法提取的特征不能有效地区分启动子序列和非启动子序列;另一方面,没有考虑转录开始位点簇对预测结果的影响。针对以上问题,本文提出了一种基于DNA结构特性谱的Markov链模型,使用统计模型对启动子和非启动子序列进行建模,以更好地区分启动子和非启动子。本文利用结构特性区域平均值谱与TSS簇的相关关系提出了一种初步定位可能TSS簇区域的算法,然后在这些区域内,对预测位点的得分进行加权,从而抵消邻近位点的干扰,提高预测算法整体的效果。实验结果表明:本文的方法优于EP3和ProSOM,具有较强的泛化能力,能在检出率和正确率上达到良好的平衡,取得最佳的总体性能;另外,本文的方法在不同的染色体上的效果都是一致的,这说明本文的方法具有较强的稳定性。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 第1章 基础知识
  • 1.1 遗传信息载体——DNA
  • 1.2 真核生物基因组
  • 1.3 基因表达调控
  • 1.4 转录与转录调控
  • 1.5 启动子简介
  • 1.5.1 启动子分类
  • 1.5.2 核心启动子的作用
  • 1.5.3 典型的核心启动子元件
  • 第2章 启动子预测方法简介
  • 2.1 特异性启动子识别方法
  • 2.1.1 基于共有序列(Consensus sequences)的方法
  • 2.1.2 位置权重矩阵法(Position weight matrix,PWM)
  • 2.1.3 模体(motif)法
  • 2.2 通用启动子识别方法
  • 2.2.1 基于信号特征的方法
  • 2.2.2 基于结构特征的方法
  • 2.2.3 基于文本特征的方法
  • 2.2.4 组合的方法
  • 2.3 总结
  • 第3章 转录开始位点簇区域的结构值特性研究
  • 3.1 转录开始位点簇
  • 3.1.1 现有成簇策略及缺陷
  • 3.1.2 本文的策略
  • 3.2 DNA结构特性
  • 3.2.1 结构特性转换表和结构特性谱
  • 3.2.2 结构特性区域平均值谱
  • 3.2.3 区域谱特性研究
  • 3.3 转录开始位点簇的宽度与区域平均值的相关性分析
  • 3.4 基于区域谱的TSS簇区域预测
  • 3.5 实验方法和结果分析
  • 3.6 本章小结
  • 第4章 基于DNA结构谱的Markov链模型在启动子预测中的应用研究
  • 4.1 思想来源
  • 4.2 算法流程
  • 4.2.1 基于DNA结构谱的Markov链模型
  • 4.2.2 基于Markov链模型的启动子预测算法
  • 4.2.3 基于预测的TSS簇区域的后处理
  • 4.3 实验方法和结果分析
  • 4.3.1 评价标准
  • 4.3.2 训练样本集的预测实验及结果分析
  • 4.3.3 染色体的预测实验及结果分析
  • 4.4 本章小结
  • 第5章 总结与展望
  • 参考文献
  • 致谢
  • 附录
  • 相关论文文献

    • [1].植物人工启动子的研究进展[J]. 分子植物育种 2019(22)
    • [2].启动子的类型及应用[J]. 山西农业科学 2017(01)
    • [3].哺乳动物可变启动子的功能及其与疾病的关系[J]. 上海交通大学学报(医学版) 2017(04)
    • [4].谷氨酸棒状杆菌新型诱导启动子的研究[J]. 海南师范大学学报(自然科学版) 2016(02)
    • [5].植物启动子研究进展[J]. 生物技术通报 2015(02)
    • [6].植物启动子研究进展[J]. 北方园艺 2015(22)
    • [7].通过串联启动子实现纳豆激酶在枯草芽孢杆菌中的高效表达[J]. 现代食品科技 2016(11)
    • [8].植物受病原物诱导启动子概述[J]. 植物保护学报 2014(02)
    • [9].串联双病原物诱导启动子驱动基因表达的特性[J]. 植物病理学报 2013(04)
    • [10].双启动子对增强型绿色荧光蛋白表达的影响[J]. 中国生物制品学杂志 2009(10)
    • [11].粗糙集理论在启动子识别中的应用研究[J]. 计算机与数字工程 2008(04)
    • [12].信号转导与转录激活子1对高迁移率族蛋白1启动子转录的调控作用[J]. 广州医科大学学报 2020(02)
    • [13].植物基因工程中人工启动子的研究进展[J]. 植物生理学报 2011(02)
    • [14].一个硫化叶菌病毒启动子的分离与鉴定[J]. 应用与环境生物学报 2019(02)
    • [15].大豆组织特异启动子的克隆与功能分析[J]. 中国油料作物学报 2017(06)
    • [16].高等植物启动子研究概述[J]. 分子植物育种 2018(05)
    • [17].耐盐小麦中TaSC基因启动子的克隆及调控功能分析[J]. 作物学报 2018(04)
    • [18].启动子结构、功能预测和验证方法的研究进展[J]. 分子植物育种 2018(12)
    • [19].大肠杆菌染色体上严谨型启动子的构建[J]. 微生物学通报 2018(08)
    • [20].植物逆境相关启动子及功能[J]. 遗传 2010(03)
    • [21].启动子的潜在语义索引差异识别算法[J]. 烟台大学学报(自然科学与工程版) 2010(03)
    • [22].山羊角蛋白14基因启动子分析及其多态性研究[J]. 中国畜牧兽医 2012(08)
    • [23].细菌启动子识别及应用研究进展[J]. 生物工程学报 2010(10)
    • [24].报告基因法比较两种放线菌启动子的活性[J]. 微生物学报 2009(11)
    • [25].筛选脱氮假单胞菌启动子提高维生素B_(12)产量[J]. 生物技术通报 2017(08)
    • [26].启动子替代构建克雷伯氏菌普鲁兰酶高产菌株[J]. 食品与发酵工业 2015(10)
    • [27].枯草芽孢杆菌表达系统及其启动子研究进展[J]. 生物技术通报 2015(02)
    • [28].植物人工启动子研究进展[J]. 广东农业科学 2014(06)
    • [29].基于一致序列多样性分析的启动子预测方法[J]. 生物信息学 2012(03)
    • [30].IL-10启动子-592基因多态性与肠易激综合征的关系[J]. 现代医院 2010(09)

    标签:;  ;  ;  

    基于DNA结构特性的启动子预测方法研究
    下载Doc文档

    猜你喜欢