G蛋白偶联受体功能位点与功能性SNPs的预测

G蛋白偶联受体功能位点与功能性SNPs的预测

论文摘要

G蛋白偶联受体(G protein-coupled receptors,GPCRs)又称为七a螺旋跨膜蛋白受体,是目前最大的蛋白质受体超家族之一。它由N末端、7个跨膜a螺旋、C末端、3个胞外环及3个胞内环组成。其中,N端在胞外,C端在胞内,7个跨膜a螺旋反复穿越细胞膜的脂双层。人类基因组测序表明,人类基因组中大约有1200个基因是属于GPCRs,它们识别并结合细胞外信号分子包括光、生物胺、肽类、糖蛋白、脂类、核苷酸、离子、蛋白酶等,激活细胞内的G蛋白。活化后的G蛋白a亚基和βγ亚基发生解离,调节相关酶活性,在细胞内产生第二信使,从而将细胞外信号跨膜传递到细胞内的效应分子,引起细胞内的一系列变化。GPCRs的功能失调会导致许多疾病的产生,如阿尔茨海默氏症、帕金森症、忧郁症、高血压、糖尿病、精神分裂症等,因而GPCRs在制药领域中占有极其重要的地位,目前世界小分子药物市场中有三分之一以上的药物作用靶点是GPCRs。研究GPCRs的功能位点和功能性SNPs对于药物设计具有重要意义,本文主要利用生物信息学的方法来预测GPCRs的功能位点和功能性SNPs。所有的GPCRs具有相同的结构和相似的活化机制,但是却能够调节不同的生理过程,这是因为不同的残基在GPCRs中起着不同的作用。本文首先以GPCRs的一个亚家族生物胺受体作为研究对象,建立了功能位点的预测模型。该模型根据已有的亚家族定义,利用父家族和亚家族保守性的差异,从整体和局部两方面对生物胺受体的功能位点进行预测,并结合已有的突变实验结果,对这部分功能位点的作用进行分析。进而将功能位点的预测模型推广到了整个GPCRs上,对GPCRs其它家族的功能位点进行了预测。获得如下结果:(1)生物胺受体的全局功能位点在整个生物胺家族中高度保守,主要位于受体的跨膜区。生物胺受体的全局功能位点维持着生物胺受体的共同结构,与生物胺受体家族的共性有关。(2)在生物胺受体家族中可变,但在生物胺受体的某一个亚家族中保守的氨基酸与该亚家族所特有的功能紧密相关。不同亚家族特有的功能位点存在着数量和分布上的差异。亚家族特有的功能位点主要位于受体的跨膜区,第二个胞外环和胞内环上,对于受体与配基的结合或与G蛋白的偶联具有重要作用。本文采用机器学习的方法对GPCRs的功能性SNPs进行预测。1R算法、x2统计量、信息增益三种方法分别用来衡量单个属性的预测能力。本文使用遗传算法进行前向搜索,分别根据基于相关性原则、基于一致性原则和封装法选择预测属性集。比较了决策树、支持向量机、K近邻三种分类方法在不同的属性集上的分类性能,选择出用于预测的最优预测属性集和分类算法。获得如下结论:(1)从单个属性来讲,突变位点的保守性最能区分功能性突变和非功能性突变,而预测的结构信息的分类效果较差。结合序列和结构属性可以提高分类性能,但是简单的将所有属性用于预测并不能取得最好的预测效果。(2)基于封装法的属性集是用于预测GPCRs功能性SNPs的最优属性集。该属性集包括了6个方面的属性:突变位点的保守性、突变前后疏水性的变化、BLOSUM62替代矩阵值、突变位置、相对溶剂可及性和掩埋电荷。预测的最优属性集既包含了序列的属性,也包含了结构的属性,因此,对于结构未知的蛋白质来说,预测的结构信息也有助于提高分类的准确性。(3)使用决策树方法和最优属性集进行分类的准确性为91.17%,而且具有很好的泛化性能。决策树方法不仅可以得到较好的分类效果,而且可以得到一些可理解的规则以及每条规则的准确性。SNPs规则库共包含了30条规则,其中16条用于判断功能性SNPs,14条用于判断非功能性SNPs。(4)dbSNP中共包括了519个人类GPCRs的非同义SNPs,利用决策树方法和最优属性集,预测出了其中166个为功能性SNPs。进一步地分析和研究这些功能性SNPs对于疾病易感性研究和个体化医疗具有重要意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 GPCRs概述
  • 1.2.1 GPCRs的结构
  • 1.2.2 GPCR超家族的分类和GPCR数据库
  • 1.2.3 GPCRs配基结合域
  • 1.2.4 GPCRs活化的分子机制和模式
  • 1.2.5 GPCRs的二聚化
  • 1.2.6 GPCRs失敏和内吞
  • 1.2.7 GPCRs的信号传导机制
  • 1.3 研究内容和目的
  • 1.3.1 研究内容
  • 1.3.2 研究目的
  • 1.4 论文的组织结构
  • 第二章 G蛋白偶联受体功能位点的预测
  • 2.0 前言
  • 2.1 材料和方法
  • 2.1.1 材料
  • 2.1.2 方法
  • 2.2 结果
  • 2.2.1 一致序列的跨膜区
  • 2.2.2 生物胺受体各家族的保守性
  • 2.2.3 特异性阈值和序列数目之间的关系
  • 2.2.4 全局功能位点
  • 2.2.5 子家族特有的功能位点
  • 2.3 讨论
  • 2.3.1 全局功能位点分析
  • 2.3.2 子家族特有功能位点分析
  • 2.3.3 预测方法和性能分析
  • 2.3.4 GPCRs其它家族功能位点
  • 2.4 本章总结
  • 第三章 G蛋白偶联受体功能性SNPs的预测
  • 3.0 前言
  • 3.1.材料和方法
  • 3.1.1 数据集
  • 3.1.2 预测属性
  • 3.1.3 预测方法
  • 3.1.4 单个属性预测能力
  • 3.1.5 最优属性子集的选择
  • 3.1.6 搜索策略
  • 3.1.7 算法性能评价
  • 3.2 结果
  • 3.2.1 功能性突变和非功能性突变在属性上的分布
  • 3.2.2 单个属性的预测能力分析
  • 3.2.3 最优属性子集
  • 3.2.4 最优属性子集的验证
  • 3.2.5 决策树算法与wrapper属性子集的泛化性能
  • 3.2.6 功能性SNPs的规则库
  • 3.2.7 GPCRs中的功能性SNPs
  • 3.2.8 不同家族功能性SNPs的分布
  • 3.3 讨论
  • 3.4 本章总结
  • 第四章 结论与展望
  • 4.1 结论
  • 4.2 展望
  • 参考文献
  • 附录:GPCRs其它家族的功能位点
  • 1.肽类受体家族功能位点
  • 2.激素受体家族功能位点
  • 3.前列腺素受体家族功能位点
  • 4.核苷类受体家族功能位点
  • 攻读博士学位期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].基于马尾松转录组测序的产脂相关SNPs初步分析[J]. 广西林业科学 2020(02)
    • [2].10个SNPs与京海黄鸡生长性状的关联性分析[J]. 中国兽医学报 2015(12)
    • [3].维生素D受体SNPs基因多态性与新疆汉族2型糖尿病视网膜病变相关性研究[J]. 新疆医科大学学报 2016(09)
    • [4].大口黑鲈转录组SNPs筛选及其与生长的关联分析[J]. 水生生物学报 2016(06)
    • [5].基于基因组SNPs的南极恩克斯堡岛阿德利企鹅繁殖种群的遗传结构[J]. 生物多样性 2019(12)
    • [6].西安市30~36月龄幼儿肥胖遗传度及4个SNPs位点多态性分析[J]. 中国当代儿科杂志 2020(04)
    • [7].The Association between LINC00511 Variants and Breast Cancer Susceptibility among the Han Chinese Population[J]. Journal of Nutritional Oncology 2020(02)
    • [8].肌联蛋白基因SNPs位点多态性与延边黄牛生长性状间的关联分析[J]. 畜牧与兽医 2017(10)
    • [9].脑源性神经营养因子基因3个SNPs位点与精神分裂症的相关性[J]. 宁夏医科大学学报 2010(09)
    • [10].金定鸭卵巢组织转录组SNPs和可变剪接分析[J]. 中国家禽 2020(02)
    • [11].GnRH基因SNPs与鹅体组成和蛋品质性状的关联分析[J]. 中国畜牧杂志 2020(10)
    • [12].Association of single nucleotide polymorphisms of tissue factor and tissue factor pathway inhibitor with venous thromboembolism in patients with lung cancer[J]. China Medical Abstracts(Internal Medicine) 2018(02)
    • [13].新疆褐牛产奶性状候选基因SNPs检测及其遗传效应分析[J]. 中国农学通报 2017(20)
    • [14].随机森林方法在致病SNPs检测中的应用[J]. 世界科技研究与发展 2012(04)
    • [15].Identification of a combination of SNPs associated with Graves' disease using swarm intelligence[J]. Science China(Life Sciences) 2011(02)
    • [16].Differences in clinical and genetic characteristics between early-and late-onset narcolepsy in a Han Chinese cohort[J]. Neural Regeneration Research 2020(10)
    • [17].美洲水貂刺鼠信号蛋白基因SNPs检测及其与毛色表型的关联分析[J]. 畜牧兽医学报 2016(04)
    • [18].中国一短指畸形家系20p12.2-12.3中非编码区的SNPs报道[J]. 中国优生与遗传杂志 2013(07)
    • [19].基于GBS技术的新杨绿壳纯系蛋鸡SNPs检测[J]. 中国家禽 2018(13)
    • [20].太平洋牡蛎HSP70基因SNPs开发及其与温度相关性分析[J]. 广东海洋大学学报 2017(03)
    • [21].翘嘴鳜淀粉酶基因SNPs和微卫星位点多态性的检测[J]. 暨南大学学报(自然科学与医学版) 2013(01)
    • [22].Identification of SNPs and Their Effects on Swine Growth and Carcass Traits for Porcine IGFBP-3 Gene[J]. Agricultural Sciences in China 2008(05)
    • [23].Relationship between glucokinase gene 6 tag single nucleotide polymorphism sites and type 2 diabetes mellitus[J]. China Medical Abstracts(Internal Medicine) 2016(01)
    • [24].小型猪生长激素基因启动子区SNPs分析[J]. 畜牧兽医学报 2009(05)
    • [25].结肠癌中奥沙利铂毒性和耐药性相关基因SNPs的研究进展[J]. 临床与病理杂志 2014(06)
    • [26].肿瘤坏死因子基因6个SNPs与河南汉族原发性高血压的相关性研究[J]. 中国慢性病预防与控制 2011(06)
    • [27].凡纳滨对虾α-淀粉酶基因的SNPs检测[J]. 水产科学 2008(07)
    • [28].贵妃鸡肌细胞生成素基因SNPs检测及其与屠宰性状的相关性分析[J]. 中国畜牧兽医 2013(11)
    • [29].个体识别SNPs位点组合筛选与法医学应用价值初探[J]. 中国法医学杂志 2014(02)
    • [30].β_2肾上腺素受体基因5个位点SNPs与河南汉族原发性高血压关系的研究[J]. 中国慢性病预防与控制 2010(04)

    标签:;  ;  ;  ;  

    G蛋白偶联受体功能位点与功能性SNPs的预测
    下载Doc文档

    猜你喜欢