果蝇、线虫基因组中基因重复的适应性演化

果蝇、线虫基因组中基因重复的适应性演化

论文摘要

基因重复是在生物体细胞内产生相似DNA片段的事件,是真核生物中重要的生物学过程,并在物种演化过程中扮演重要角色。基因重复能够为生物体基因组的演化及新功能基因的产生提供最基本的物质和原材料基础,并由此导致新物种的诞生。生物体通过基因重复事件来增加基因组中基因的拷贝数,以适应不同环境及发育的需要。因此,对基因重复遗传规律的研究,可进一步了解生物体演变规律,为人工定向改造基因、人为创造新基因以提高物种品质提供理论基础。本文从12个已测序的、全球分布的果蝇基因组中,鉴定出了 22488个基因家族,其中存在新近重复的基因家族共3647个,占基因家族总数的16.2%。依据不同的扩张模式,我们进一步将这些新近重复基因家族分为三类:物种特异性扩张、世系特异性扩张及复杂型扩张基因家族。其中第一种扩张类型占据了极大的比例(86.6%)。在同一个复杂型扩张基因家族中,存在多个不同物种之间发生独立的物种特异性基因重复事件;在物种特异性扩张基因家族中,不同物种共有新近基因重复热点。这些结果表明,这些新近重复基因受到趋同演化的作用。通过对新近重复基因蛋白质结构域的比较发现,新近重复基因具有功能偏好性,并多与应对环境刺激及生物胁迫有关。对新近重复基因的旁系同源基因和直系同源基因的非同义替换率(Ka)和同义替换率(Ks)的计算发现,部分基因受到正选择压力的驱动(Ka/Ks>1)。对这些受正选择作用的新近重复基因家族的功能评估表明,其存在功能偏好性,并与其地理分布、食物来源等因素相关。说明,果蝇基因组中的新近重复的基因为了应对不同的生态环境而受到了适应性演化的驱动。为了进一步验证重复基因对于环境、发育过程等因素的适应性,我们对果蝇基因组中的胰蛋白酶基因家族以及线虫基因组中的patched同源基因家族的扩张和演化模式进行了进一步探讨。首先,在12个果蝇物种中,我们发现了 2598个胰蛋白酶基因拷贝,平均每个物种中有217个,但这些基因拷贝在12个物种中分布并不均匀,数目从167到258个不等。那些具有相近亲缘关系的物种基因组内胰蛋白酶基因拷贝数比较相近,说明胰蛋白酶基因重复事件与果蝇物种的系统发生相关。以腐烂水果为生的果蝇基因组中胰蛋白酶拷贝数显著大于以腐烂树木为生的果蝇,且分布于非洲的物种基因组内的胰蛋白酶数要显著高于分布于美洲或亚洲的物种,因此,食物来源在胰蛋白酶基因演化过程中起到十分重要的作用,而地理分布则作为一种附加的诱导因素。通过推断胰蛋白酶基因重复事件发生的时间发现,这些重复事件并非同时发生,而是与生态环境的改变或是宿主改变相关的。此外,我们还发现,狭生性物种相对广生性物种具有较高的Ka/Ks值以及动态的基因重复/缺失事件。说明,该家族的基因重复在果蝇适应不同生态环境中起到了重要的作用。其次,对patched同源基因家族的研究表明,patched同源基因在植物和动物中都比较保守,而且patched同源基因的扩张事件应该发生在线虫物种形成的早期。通过对系统发生树、基因和物种的协调树的研究以及对Ks值的计算发现,PTR类型基因在线虫物种形成之后相对较短的时间内发生了两次扩张。此外,相对近期起源的patched同源基因相较于相对古老起源的patched同源基因,它们的外显子数目较少并且CDS长度较短。不同类型的patched同源基因具有不同的演化模式,PTR类型基因的扩张有利于线虫特异性的适应。本文通过近缘物种中重复基因的比较发现,尽管不同的基因重复家族存在不同的基因功能偏好及遗传变异特征,但纵观整个研究,这些基因重复却具有极相似演化模式,那就是适应性演化在重复基因的演化历程中扮演了重要的角色。

论文目录

  • 前言
  • 中文摘要
  • 英文摘要
  • 主要缩略词
  • 第一章: 绪论-基因重复现象的研究现状
  • 1.1 引言-基因重复现象的概述
  • 1.2 基因重复的产生机制
  • 1.2.1 不等交换(unequal crossing over)
  • 1.2.2 逆转录转座(retroposition)
  • 1.2.3 染色体或基因组范围的重复(chromosomal or genome duplication)
  • 1.3 重复基因的演化模型(evolutionary models)
  • 1.3.1 第一大类
  • 1.3.2 第二大类
  • 1.3.3 第三大类
  • 1.3.4 第四大类
  • 1.4 重复基因的演化命运
  • 1.4.1 假基因化(pseudogenization)
  • 1.4.2 亚功能化(subfunctionalization)
  • 1.4.3 新功能化(neofunctionalization)
  • 1.5 基因重复演化上的贡献
  • 1.5.1 提供演化必要的材料
  • 1.5.2 基因表达多样性的增加
  • 1.5.3 物种的适应性演化
  • 1.6 果蝇、线虫中基因重复的研究进展
  • 1.6.1 果蝇中基因重复的研究
  • 1.6.2 线虫中基因重复的研究
  • 1.7 本研究的背景、目的和意义
  • 1.8 参考文献
  • 第二章: 功能需求驱动的12个果蝇基因组中新近重复基因的适应性演化
  • 2.1 引言
  • 2.2 材料与方法
  • 2.2.1 实验材料
  • 2.2.2 新近重复基因家族的鉴定
  • 2.2.3 新近重复基因家族系统发生树的构建
  • 2.2.4 染色体上新近重复热点的随机模拟
  • 2.2.5 新近重复基因家族的结构域预测
  • 2.2.6 新近重复基因同义替换率、非同义替换率以及重复年代的计算
  • 2.3 结果
  • 2.3.1 新近重复基因家族的数目及分类
  • 2.3.2 新近重复基因家族的染色体分布
  • 2.3.3 新近重复基因家族的功能偏好
  • 2.3.4 旁系同源基因(paralog)与直系同源基因(ortholog)的选择压力
  • 2.3.5 新近基因重复事件的发生年代对比
  • 2.4 讨论
  • 2.4.1 新近重复基因的趋同演化
  • 2.4.2 新近重复基因的适应性演化
  • 2.4.3 适应性演化驱动特异性功能偏好
  • 2.5 小结
  • 2.6 参考文献
  • 第三章: 新近基因重复驱动12个果蝇基因组中胰蛋白酶(Trypsin)基因的快速演化
  • 3.1 引言
  • 3.2 材料与方法
  • 3.2.1 实验材料
  • 3.2.2 胰蛋白酶基因的鉴定
  • 3.2.3 胰蛋白酶基因家族系统发生树的构建
  • 3.2.4 胰蛋白酶基因家族复制/缺失事件的统计
  • 3.2.5 胰蛋白酶基因家族的同义替换率、非同义替换率以及重复年代的计算
  • 3.3 结果
  • 3.3.1 胰蛋白酶基因家族的重复/缺失事件的演化模式
  • 3.3.2 胰蛋白酶基因家族的重复事件与食物来源相关
  • 3.3.3 胰蛋白酶基因重复发生年代
  • 3.3.4 驱动胰蛋白酶基因演化的选择压力
  • 3.4 讨论
  • 3.4.1 胰蛋白酶基因的适应性演化
  • 3.4.2 胰蛋白酶基因的辐射型演化模式
  • 3.4.3 适应性演化赋予物种差异性
  • 3.5 小结
  • 3.6 参考文献
  • 第四章: Patched同源基因家族的演化模式
  • 4.1 引言
  • 4.2 材料与方法
  • 4.2.1 实验材料
  • 4.2.2 Patched同源基因的鉴定
  • 4.2.3 基因家族系统发生树
  • 4.2.4 协调树(reconciled tree)的构建
  • 4.2.5 同义替换率及核苷酸差异度的计算
  • 4.2.6 Patched同源基因在秀丽线虫染色体上的分布
  • 4.3 结果
  • 4.3.1 Patched同源基因数目及分类
  • 4.3.2 Patched同源基因家族系统演化分析
  • 4.3.3 Patched同源基因在线虫中的重复模式
  • 4.3.4 Patched同源基因的外显子(exon)演化模式
  • 4.3.5 直系同源基因在三个隐杆线虫属(Caenorhabditis)物种中的比较
  • 4.4 讨论
  • 4.4.1 Patched同源基因在线虫中的重复模式
  • 4.4.2 Patched同源基因在线虫中的基因功能
  • 4.5 小结
  • 4.6 参考文献
  • 全文结论
  • 致谢
  • 攻读博士期间科研成果
  • 附录A
  • 附录B
  • 相关论文文献

    标签:;  ;  ;  

    果蝇、线虫基因组中基因重复的适应性演化
    下载Doc文档

    猜你喜欢