基于密码子水平的生物信息学分析及进化研究

基于密码子水平的生物信息学分析及进化研究

论文摘要

密码子水平的生物信息学分析是研究基因组进化、蛋白质功能以及遗传和环境相互作用等课题中一个的重要环节。本文中,我们从密码子使用模式的比较基因组分析、密码子用法作为构建系统发育树的方法以及基于密码子置换模型的适应性进化检测等三个方面进行了探索。论文的主要内容如下:1.密码子的使用频率并不是完全随机的,而是有一定的偏好性,即有的密码子比起其他同义密码子来说使用频率更高,这种现象在原核、真核生物中都广泛存在。研究不同基因组中密码子使用模式以及影响这种模式形成的内在因素,对于了解基因组特征和分子进化历史事件具有重要的启示作用。我们对同一物种中不同基因组问以及不同物种基因组间的密码子用法进行了一系列对应比较,并且进一步研究了影响密码子使用的因素。●基因或是基因组间密码子使用的差异往往反映了碱基组成的偏好性或是自然选择的强度。我们比较分析了普通小麦(Triticum aestivum)的核基因以及线粒体、叶绿体等细胞器基因组间在密码子偏好性特征和影响因素上的差异。核基因中的GC含量明显高于线粒体和叶绿体基因中的。中性绘图和对应性分析的结果都表明核基因中的密码子使用模式是突变压力造成的,而线粒体和叶绿体基因组中GC含量更加保守,密码子偏好性主要反映了弱的自然选择效应下翻译水平的影响。奇偶原则绘图分析显示在密码子第三位上嘧啶的使用频率高于嘌呤。此外,在线粒体、叶绿体和核基因中分别有11,12和24个密码子被鉴定为最优密码子。以上这些结果表明由于主要承受的进化约束力不同,在线粒体、叶绿体和核基因中的密码子使用也呈现出不同的特征。●我们比较分析了单子叶植物和双子叶植物在密码子使用的模式差异,分别选取了线粒体和核基因作为研究对象。在GC含量方面,双子叶植物显现出一定的保守性,其核基因在中性绘图和ENC绘图分析中的密码子使用模式与其线粒体中相似。而单子叶植物,尤其是禾本科植物水稻和小麦中,GC含量更高,其密码子使用,尤其是核基因中的密码子使用明显反映的是核酸组成偏好性,说明基因变异更多地受突变压力影响。●小麦种子储存蛋白在氨基酸用法上有明显偏好性,使得编码这类蛋白的基因在590个基因的数据集中和其他基因明显分别开来。进一步的研究表明,密码子使用的对应性分析结果可以在基因家族内部将编码小麦种子储存蛋白不同亚基的序列区分开来。基因家族成员在密码子使用上存在趋同性,出现一定程度上的聚类现象。2.基于近缘关系的物种基因组中密码子用法相似这一原理,我们提出一种新的思路,将密码子用法和其他衡量序列间差异的指标,如序列长度,结合起来作为一种非对位排列式的构建系统发育树的方法初步应用于病毒的数据,从基因组以及各个蛋白编码序列的构树结果来看,树的拓扑结构符合预期结果。3.非同义-同义置换速率比值(dN/dS)是藉蛋白质编码序列评价选择压力的一种重要测度,而基于密码子置换模型的最大似然法业已成为检测承受正选择的氨基酸位点及适应性进化的统计分析工具。我们应用最大似然法分析了丙型肝炎病毒的包膜蛋白编码序列,从全世界18个常见的基因型/亚型中,发现了4个正选择/适应性位点。由于这些氨基酸位点位于不同的免疫表位,我们的研究结果具有潜在的生物医学价值,同时表明最大似然法可以作为一种检测高分歧度病毒蛋白中适应性进化存在与否的有效手段。除了最大似然法,Suzuki-Gojobori方法也是检测适应性进化位点的重要方法之一。我们用Suzuki-Gojobori的方法检测了基因亚型1a和1b的各个编码序列中承受正选择的氨基酸位点,分别有3和33个位点被检测出来,这些位点大部分位于免疫表位上。4.碱基组成偏好和选择效应下的基因表达水平所导致的密码子偏好性不易被完全区分开,我们提出一种简便的策略以排除序列自身碱基组成偏好的背景干扰,从而鉴定与翻译效率相关的最优密码子。研究中采用了分别来自原核生物(大肠杆菌)、低等真核生物(酵母)和高等真核生物(植物)的三组不同类型的数据来验证我们的新策略,并与以前的方法以及报道作了一定比较,结果显示我们的方法更加严格、可靠,有效地排除了碱基组成的影响。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 基因组时代的生物信息学分析
  • 1.1.1 生物信息学的产生与发展
  • 1.1.2 比较基因组分析
  • 1.2 同义密码子使用模式
  • 1.2.1 遗传编码系统
  • 1.2.2 同义密码子使用模式
  • 1.2.3 密码子使用偏好性及其生物学基础
  • 1.2.4 研究密码子使用模式的意义
  • 1.3 分子系统发育分析和分子进化研究方法
  • 1.4 适应性进化和自然选择
  • 1.5 本研究工作的目的和技术路线
  • 第二章 高等植物基因组中密码子使用模式分析
  • 2.1 同义密码子使用的分析方法
  • 2.1.1 衡量同义密码子偏好性的各项指标
  • 2.1.2 分析密码子使用模式的统计方法
  • 2.1.3 分析密码子使用模式的各种生物信息学资源
  • 2.2 核、线粒体以及叶绿体基因的密码子使用模式比较—以小麦为例
  • 2.2.1 前言
  • 2.2.2 数据
  • 2.2.3 方法
  • 2.2.4 结果
  • 2.2.5 讨论
  • 2.3 单子叶植物和双子叶植物基因组中密码子使用模式的比较
  • 2.3.1 前言
  • 2.3.2 数据
  • 2.3.3 方法
  • 2.3.4 结果
  • 2.3.5 讨论
  • 2.4 利用对应性分析方法鉴定小麦种子储存蛋白编码基因
  • 2.4.1 前言
  • 2.4.2 数据
  • 2.4.3 方法
  • 2.4.4 结果
  • 2.4.5 讨论
  • 第三章 密码子使用模式在构建系统发育树上的应用
  • 3.1 系统发育树的构建
  • 3.1.1 分子系统发育树的构建方法
  • 3.1.2 非对位排列的基因组构树方法
  • 3.1.3 利用密码子使用模式构建进化树的方法
  • 3.2 结合密码子使用模式和序列长度的方法构建系统发育树
  • 3.2.1 前言
  • 3.2.2 数据
  • 3.2.3 方法
  • 3.2.4 结果
  • 3.2.5 讨论
  • 第四章 基于密码子水平的适应性进化检测—以HCV病毒为例
  • 4.1 基因重复和适应性进化
  • 4.2 最大似然法
  • 4.2.1 最大似然法和似然比检验
  • 4.2.2 密码子替代模型
  • 4.2.3 分支间可变选择压力模型的似然比检验
  • 4.2.4 位点间可变选择压力模型的似然比检验
  • 4.2.5 分支—位点间可变选择压力模型的似然比检验
  • 4.2.6 PAML软件
  • 4.3 Suzuki-Gojobori法检测正选择
  • 4.3.1 原理
  • 4.3.2 软件
  • 4.4 检测适应性进化的两种主要方法间的比较
  • 4.5 应用最大似然法检测 HCV包膜蛋白编码基因的适应性进化
  • 4.5.1 前言1: HCV的遗传多样性和分子流行病学特征
  • 4.5.2 前言2: HCV的防治现状
  • 4.5.3 前言3: HCV适应性进化位点研究
  • 4.5.4 数据
  • 4.5.5 方法
  • 4.5.6 结果
  • 4.5.7 讨论
  • 4.6 应用 Suzuki-Gojobori法检测 HCV不同基因亚型的适应性进化位点
  • 4.6.1 数据
  • 4.6.2 方法
  • 4.6.3 结果
  • 4.6.4 讨论
  • 第五章 一种新的推测基因序列中最优密码子的策略
  • 5.1 前言
  • 5.2 数据
  • 5.3 方法
  • 5.4 结果与讨论
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 进一步研究的方向
  • 参考文献
  • 致谢
  • 附录
  • 附录1
  • 附录2
  • 附录3
  • 附:已正式发表的论文
  • 相关论文文献

    • [1].巨桉叶绿体基因组密码子偏好性分析[J]. 广西植物 2019(12)
    • [2].两种梧桐叶绿体基因组密码子使用偏性分析[J]. 广西植物 2020(02)
    • [3].密码子使用偏好性对生物钟基因表达模式及功能的影响[J]. 生物学教学 2020(03)
    • [4].基于转录组数据分析药用真菌猪苓密码子使用偏好性[J]. 药学学报 2020(05)
    • [5].马尾松转录组密码子使用偏好性及其影响因素[J]. 林业科学 2020(04)
    • [6].云南蓝果树叶绿体基因组密码子偏好性分析[J]. 西北林学院学报 2020(04)
    • [7].乳油木叶绿体基因组密码子偏好性分析[J]. 分子植物育种 2020(17)
    • [8].美国红梣叶绿体基因组密码子偏好性分析[J]. 江苏农业科学 2020(15)
    • [9].遗传密码子的起源——从能量转化到信息化[J]. 生物多样性 2017(01)
    • [10].寨卡病毒基因组密码子偏爱性分析[J]. 基因组学与应用生物学 2017(02)
    • [11].中东呼吸综合征冠状病毒结构蛋白与附属蛋白编码基因密码子偏爱性分析[J]. 病毒学报 2016(04)
    • [12].川贝母转录组密码子使用偏好性分析[J]. 中国中药杂志 2016(11)
    • [13].密码子偏性分析方法及茶树中密码子偏性研究进展[J]. 茶叶通讯 2016(02)
    • [14].大豆花叶病毒密码子使用及其进化分析[J]. 大豆科学 2014(06)
    • [15].埃博拉病毒包膜糖蛋白的密码子偏爱性分析[J]. 医学研究杂志 2015(03)
    • [16].高中生物教学中“一”的辨析[J]. 中学生物教学 2017(05)
    • [17].基因科学新发现:所有密码子都可能成为起始密码子[J]. 飞碟探索 2017(04)
    • [18].植物抗病基因密码子使用特性分析[J]. 山东农业大学学报(自然科学版) 2013(04)
    • [19].落叶松-杨栅锈菌基因组密码子使用偏好分析[J]. 菌物学报 2020(02)
    • [20].茶树密码子使用偏性分析方法及其研究进展[J]. 分子植物育种 2020(05)
    • [21].小球藻叶绿体基因组密码子偏好性分析[J]. 分子植物育种 2020(17)
    • [22].秋茄叶绿体基因组密码子使用偏好性分析[J]. 森林与环境学报 2020(05)
    • [23].茄腐镰孢(Fusarium solani)线粒体基因组密码子偏好性分析[J]. 基因组学与应用生物学 2015(11)
    • [24].长春花密码子使用偏好性分析[J]. 中国中药杂志 2016(22)
    • [25].密码子使用偏性量化方法研究综述[J]. 基因组学与应用生物学 2013(05)
    • [26].铁核桃叶绿体基因组密码子偏好性分析[J]. 分子植物育种 2020(20)
    • [27].红豆杉属基因的密码子偏性分析[J]. 湖北农业科学 2013(10)
    • [28].多杀性巴氏杆菌的遗传密码子偏好性初步分析[J]. 黑龙江畜牧兽医 2012(09)
    • [29].鸡七号染色体上的最优密码子[J]. 畜牧与饲料科学 2012(07)
    • [30].牛乳蛋白的遗传密码子使用频率分析[J]. 中国兽医学报 2011(02)

    标签:;  ;  ;  ;  ;  

    基于密码子水平的生物信息学分析及进化研究
    下载Doc文档

    猜你喜欢