肽链中脯氨酸的生物信息学与分子动力学研究

肽链中脯氨酸的生物信息学与分子动力学研究

论文题目: 肽链中脯氨酸的生物信息学与分子动力学研究

论文类型: 博士论文

论文专业: 发酵工程

作者: 汪明磊

导师: 须文波

关键词: 脯氨酸,肽键,反式构象,顺式构象,多聚脯氨酸型,同义密码子,神经网络,支持向量机,隐马尔可夫模型,模拟退火

文献来源: 江南大学

发表年度: 2005

论文摘要: 脯氨酸残基对于蛋白质结构与功能具有重要意义。脯氨酸具有特殊的环状结构,加强了对肽链结构的限制,可赋予生物大分子很多特殊的生物学性质,其构象变化是很多蛋白质折叠与去折叠过程中的限速步骤,增强了基于构象识别的蛋白质相互作用的生物学作用。研究脯氨酸的构象与蛋白质一级结构间的关系,建立较为实用的模型,可为预测蛋白质结构与分析X射线衍射数据提供更多的理论依据,深入了解脯氨酸对蛋白质的影响,得到具有普遍意义的脯氨酸残基与蛋白质结构之间关系的信息,可为蛋白质工程提供相应的理论依据。通过计算机分子模拟,将进一步从理论计算的角度对脯氨酸在蛋白质结构形成中所起的作用及影响因素进行研究。因此,本论文从生物信息学的角度,对蛋白质中的脯氨酸进行了较为系统的研究。对脯氨酸肽键的分布与基本特征进行了分析。由分辨率小于0.25nm,同一性(identity)小于30%的2401条肽链中计算提取了全部顺式与反式脯氨酸肽键的位置,数目分别为1221个与26401个,从而建立了一个较大规模的脯氨酸肽键数据集。统计分析了该数据集的基本特征:肽键N端残基的分布、N端残基的二面角统计、在二级结构中的分布情况、顺式肽键在脯氨酸肽键中所占比例。通过运用神经网络与线性拟合的方法,揭示了脯氨酸局部序列、肽链氨基酸组分对于顺式脯氨酸形成与否的影响,构造了基于局部序列和基于氨基酸组分的最优结构的神经网络,以及线性拟合方程,同时对顺式脯氨酸进行了筛选,结果表明,利用神经网络的方法可以提高顺式脯氨酸筛选时的信噪比,脯氨酸采取顺式还是反式构象与其局部的序列以及整条肽链的氨基酸组分均有较强的关联。建立了一种基于支持向量机的预测脯氨酸肽键构象的方法。支持向量机在模式识别的多个方面都有广泛的应用。本研究使用了6种长度的局部序列,并采用了具有不同参数d的多项式核函数。对所建方法的测试也采用了两种方法:对独立的测试集测试与Jackknife检测。最后发现,当局部序列长度为20个残基,参数d=8时,支持向量机对脯氨酸肽键两种构象的预测表现最好,对独立测试集中的顺反肽键的预测准确率分别达到70.4%,69.7%,Jackknife检测时,准确率分别为76.7%,76.6%,Matthew相关系数达到0.5左右。结果表明,支持向量机的方法是预测脯氨酸肽键构象的强有力的工具。应用信息论与统计学的方法,研究了在大肠杆菌基因组的全部编码序列中,脯氨酸同义密码子用语与其局部氨基酸残基的关联,以及同义密码子用语与脯氨酸肽键构象之间的关联。研究结果表明:与脯氨酸相邻的C端第一个残基对脯氨酸同义密码子的使用有较大影响;脯

论文目录:

摘要

Abstract

第一章 绪论

1.1 生物信息学概述

1.1.1 生物信息学的定义

1.1.2 生物信息学的意义

1.1.3 生物信息学的研究内容

1.1.4 主要的蛋白质数据库

1.2 蛋白质结构预测的概述

1.3 蛋白质中的脯氨酸研究概述

1.4 分子模拟概述

1.5 统计学习理论与支持向量机算法

1.6 立题背景与主要研究内容

参考文献

第二章 脯氨酸肽键数据集的构建与基本特征分析

2.1 脯氨酸肽键数据集的构建

2.2 脯氨酸肽键数据集的特征

2.2.1 脯氨酸肽键N 端残基的分布

2.2.2 脯氨酸残基在二级结构中的分布

2.2.3 顺式肽键在脯氨酸肽键中的比例

2.3 结论

参考文献

附录

第三章 基于神经网络的由局部氨基酸序列预测脯氨酸肽键构象的方法的研究

3.1 材料与方法

3.1.1 实验数据

3.1.2 神经网络的构造

3.1.2.1 神经网络原理

3.1.2.2 网络训练与测试

3.1.3 线性拟合

3.2 测试结果

3.2.1 基于局部序列的神经网络测试结果

3.2.2 基于氨基酸组分的神经网络测试结果

3.2.3 线性拟合的测试结果

3.3 分析与讨论

参考文献

第四章 基于支持向量机的由局部氨基酸序列预测脯氨酸肽键构象的方法的研究

4.1 支持向量机简介

4.2 材料与方法

4.3 结果

4.4 讨论

参考文献

第五章 大肠杆菌基因组中脯氨酸同义密码子的研究

5.1 材料与方法

5.1.1 材料

5.1.2 方法

5.1.2.1 脯氨酸同义密码子用语与其局部氨基酸残基的关联

5.1.2.2 脯氨酸密码子第三个碱基与 C 端最近邻氨基酸密码子第一个碱基之间的上下文关联

5.1.2.3 同义密码子用语与脯氨酸肽键构象之间的关联

5.2 结果与讨论

5.2.1 脯氨酸同义密码子用语与其局部氨基酸残基的关联情况

5.2.2 同义密码子用语与脯氨酸肽键构象之间的关联

5.3 结论

参考文献

附录

第六章 基于支持向量机的由局部氨基酸序列预测多聚脯氨酸-II型的方法的研究

6.1 材料与方法

6.1.1 PDB 结构文件

6.1.2 多聚脯氨酸II 型结构的定位

6.1.3 训练集与测试集

6.1.4 支持向量机的构建

6.1.5 预测结果的评测方法

6.1.6 Z分值计算

6.2 结果

6.2.1 支持向量机的预测结果

6.2.2 Z 分值

6.3 讨论

参考文献

附录

第七章 基于隐马尔可夫模型的多聚脯氨酸-II型预测方法的研究

7.1 隐马尔可夫模型简介

7.2 材料与方法

7.2.1 PDB 结构文件

7.2.2 多聚脯氨酸II 型结构的定位

7.2.3 多聚脯氨酸II 型结构序列的联配

7.2.4 隐马尔可夫模型的建立

7.2.5 隐马尔可夫模型的测试方法

7.3 结果与讨论

参考文献

附录

第八章 缓激肽增强肽的分子动力学研究

8.1 缓激肽增强肽简介

8.2 方法

8.2.1 计算环境

8.2.2 材料

8.2.3 模拟退火的方法

8.3 结果与分析

8.3.1 Trp~2-Pro~3 与Arg~4-Pro~5 肽键的构象分布

8.3.2 Ramachandran 分布图

8.3.3 主链上的原子距离

8.3.4 能量的分布

参考文献

主要结论

发表的论文

致谢

发布时间: 2006-07-20

参考文献

  • [1].海滨锦葵耐盐生理特性及脯氨酸代谢相关基因的研究[D]. 王红艳.中国科学院烟台海岸带研究所2016
  • [2].蛋白质内含子介导的蛋白质剪接及应用[D]. 张晓.东华大学2016
  • [3].干旱胁迫诱导水稻产生可遗传表观遗传变异及其相关生理代谢变化的研究[D]. 张春玉.东北师范大学2013

相关论文

  • [1].α-淀粉酶性能与结构关系的生物信息学研究[D]. 张革新.江南大学2005
  • [2].木聚糖酶蛋白质序列分析、分子进化和分子模拟[D]. 刘亮伟.江南大学2005
  • [3].分子动力学模拟的若干基础应用和理论[D]. 殷开梁.浙江大学2006
  • [4].蛋白质二硫键结构特征与序列关系的生物信息学研究[D]. 宋江宁.江南大学2005
  • [5].嗜热菌耐热性与蛋白质序列、结构和功能关系的生物信息学研究[D]. 丁彦蕊.江南大学2005
  • [6].基因组水平生物信息学工具的开发和应用(从ReAS到WEGO)[D]. 叶葭.浙江大学2006
  • [7].基于结构生物信息学的蛋白质设计[D]. 蔡晓辉.中国科学院研究生院(上海生命科学研究院)2006
  • [8].蛋白质翻译后修饰和细胞信号通路的生物信息学[D]. 薛宇.中国科学技术大学2006
  • [9].基于密码子水平的生物信息学分析及进化研究[D]. 张文娟.复旦大学2006
  • [10].生物信息学和生物信号识别领域的机器学习算法研究[D]. 王岩.吉林大学2007

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

肽链中脯氨酸的生物信息学与分子动力学研究
下载Doc文档

猜你喜欢