蛋白质二硫键结构特征与序列关系的生物信息学研究

蛋白质二硫键结构特征与序列关系的生物信息学研究

论文题目: 蛋白质二硫键结构特征与序列关系的生物信息学研究

论文类型: 博士论文

论文专业: 发酵工程

作者: 宋江宁

导师: 须文波

关键词: 生物信息学,数据库,二硫键,半胱氨酸,二硫键形成状态预测,机器学习方法,统计关联,支持向量机,同义密码子用语,大肠杆菌,二硫键形成模式,蛋白质结构同源性

文献来源: 江南大学

发表年度: 2005

论文摘要: 二硫键是由蛋白质的两个半胱氨酸之间配对形成的一种共价键,可以存在于同一条蛋白质多肽链内,也可以存在于不同的多肽链之间。对于许多蛋白质而言,二硫键是它们最终折叠产物的永久特征。二硫键的形成是蛋白质折叠过程中的重要步骤,其形成动力学影响蛋白质折叠的速率和途径,它的错误配对是影响蛋白质多肽链正确折叠的重要原因。二硫键的存在对于维持蛋白质空间结构稳定性,保持其生理活性具有至关重要的意义。研究形成二硫键的蛋白质序列与结构特征,找出与二硫键形成有关联的某些结构信息,对于蛋白质工程和人工药物分子设计都有着积极而重要的意义。本论文以蛋白质二硫键作为研究对象,利用生物信息学这一新兴前沿交叉学科的研究方法和工具,综合运用数学,物理学,生物学和计算机科学知识,通过构建高精度高可靠性的蛋白质二硫键空间结构数据库和大肠杆菌蛋白质二硫键与对应基因序列关联数据库两类数据库,从二硫键蛋白质的基因序列、氨基酸序列和三维空间结构等三种水平上对蛋白质二硫键形成的结构特征和序列之间的关系进行较为系统和深入的研究。研究的主要内容如下:(1)高质量蛋白质二硫键空间结构数据库的构建是进行蛋白质二硫键统计计算分析的基础。按照分辨率小于0.25nm,且序列同一性(sequence identity)小于30%的原则从PISCESCulled PDB数据库中选取高精度高可靠性的蛋白质空间结构数据,在此基础上,挑选含有SSBOND记录的PDB结构数据,通过严格的结构数据文件形式错误检验、序列自洽性检验、SSBOND记录准确性检验以及SBOND成键记录校正,删除其中包含的错误和可疑数据,成功建立一个高质量的蛋白质二硫键空间结构数据库。研究蛋白质折叠与蛋白质编码序列关系问题离不开高质量蛋白质结构及其对应基因序列数据。通过查询SWISS-PROT数据库中E. coli的蛋白质,得到不同数据库中的蛋白质结构与基因序列的交叉索引表,在此基础上,删除大量冗余及不可靠数据,最后得到一个高精度大肠杆菌蛋白质结构与对应基因序列数据集-EcoPDB,这是研究蛋白质空间结构数据与核酸序列数据之间对应关系的基础数据库。(2)研究蛋白质二硫键的形成特征和序列结构特征,对于进一步研究蛋白质二硫键的形成、与氨基酸序列之间的关系,预测半胱氨酸的二硫键形成状态以及蛋白质二硫键辅助折叠动力学具有重要作用。CYS的氧化还原状态表现出一种明显的协同性现象:蛋白质序列中若有二硫键形成,那么此序列中的所有CYS或者大部分CYS倾向于采取氧化状态;二硫键在蛋白质序列中的分布很不均匀,大部分二硫键都是在序列距离小于70个氨基酸的地方形成的,存在着二硫键形成的强烈偏好序列距离,如序列距离为11,6,16,5,13个氨基酸处;相对而言,二硫键更倾向于在氨基酸序列的前半段出现,这在蛋白质翻译过程中对于保证新生肽链顺利延伸合成和减少误折叠发生有着积极意义。比较氧化态CYS和还原态CYS周围的氨基酸分布情况,发现两者周围氨基酸分布有着比较明显的差异:前者周围

论文目录:

中文摘要

ABSTRACT

第一章 绪论

1.1 生物信息学概述

1.1.1 生物信息学产生的背景

1.1.2 生物信息学的概念

1.1.3 生物信息学的意义

1.1.4 生物信息学的主要研究内容

1.1.5 生物信息学数据库

1.2 蛋白质二硫键研究综述

1.2.1 大肠杆菌蛋白质二硫键的形成

1.2.2 真核生物蛋白质二硫键的形成

1.2.3 二硫键形成预测

1.3 本论文的立题依据

1.4 本论文的主要研究内容

参考文献

第二章 高质量蛋白质二硫键空间结构数据库的构建

2.1 前言

2.2 材料与方法

2.2.1 出发数据库-PISCES Culled PDB 数据库

2.2.2 高质量蛋白质二硫键数据库的构建

2.3 结果与讨论

2.3.1 建库过程中特殊情况说明

2.3.2 高质量蛋白质二硫键数据库中的氨基酸构成

2.3.3 高质量蛋白质二硫键数据库数据格式说明

2.4 本章小结

参考文献

附表2-1

第三章 EcoPDB-高精度大肠杆菌蛋白质结构与对应基因序列数据集的构建

3.1 前言

3.2 材料与方法

3.2.1 材料

3.2.2 建库方法

3.3 结果与讨论

3.3.1 建库过程中特殊情况说明

3.3.2 数据库总体说明

3.3.3 EcoPDB 数据库分类

3.4 本章小结

参考文献

附表3-1

附表3-2

第四章 蛋白质二硫键序列分布特征分析

4.1 前言

4.2 材料与方法

4.2.1 数据库

4.2.2 分析方法

4.3 结果与讨论

4.3.1 蛋白质二硫键分布特征分析

4.3.2 半胱氨酸氧化还原状态的协同性现象

4.3.3 蛋白质序列的二硫键分布数目

4.3.4 蛋白质序列长度与二硫键的关系

4.3.5 形成二硫键的两个 CYS 之间的序列距离

4.3.6 形成二硫键的两个 CYS 之间的约化距离

4.3.7 二硫键在蛋白质序列中的出现位置

4.3.8 氧化态CYS 和还原态CYS 周围氨基酸分布

4.3.9 20 种氨基酸对于二硫键形成的贡献

4.4 本章小结

参考文献

第五章 基于统计分析方法的半胱氨酸二硫键形成状态预测

5.1 前言

5.2 材料与方法

5.2.1 数据库

5.2.2 方法

5.3 结果与讨论

5.3.1 Q 值累计分布

5.3.2 400 种二肽对二硫键形成的贡献

5.3.3 基于20 种氨基酸百分含量的预测准确率

5.3.4 基于400 种二肽百分含量的预测准确率

5.4 本章小结

参考文献

附表5-1

第六章 基于支持向量机(SVM)的半胱氨酸二硫键形成状态预测

6.1 前言

6.2 支持向量机理论

6.2.1 基本原理

6.2.2 支持向量机的应用

6.3 材料与方法

6.3.1 数据库

6.3.2 SVM 应用软件

6.3.3 方法

6.3.4 预测准确率检验方法

6.4 结果与讨论

6.4.1 20 种氨基酸对二硫键形成的贡献

6.4.2 第二层 SVM 分类器的参数优化

6.4.3 OXICYS 和REDCYS 集蛋白质的CATH 结构分类

6.4.4 两层混合分类器的预测结果

6.4.5 不同算法的半胱氨酸二硫键形成状态预测准确率比较

6.4.6 SVM 算法的优势和缺点

6.4.7 不同算法的结合及其它相关有用信息的整合

6.5 本章小结

参考文献

第七章 大肠杆菌蛋白质二硫键形成与基因密码子关联性分析

7.1 前言

7.2 影响同义密码子用语的因素

7.3 材料与方法

7.3.1 数据库

7.3.2 同义密码子携带的信息量

7.4 结果与讨论

7.4.1 半胱氨酸同义密码子用语与其局部氨基酸残基的关联情况

7.4.2 同义密码子用语与半胱氨酸二硫键形成之间的关联

7.4.3 结论

7.5 本章小结

参考文献

附表7-1

第八章 蛋白质二硫键形成模式与结构同源性关联性分析

8.1 前言

8.2 材料与方法

8.2.1 二硫键形成模式数据集

8.2.2 二硫键拓扑结构

8.2.3 二硫键形成模式相似性判别公式

8.2.4 基于二硫键形成模式的蛋白质结构分类

8.3 结果与讨论

8.3.1 二硫键形成模式计算与分类

8.3.2 基于二硫键形成模式的蛋白质结构分类

8.3.3 使用二硫键形成模式信息进行蛋白质结构预测

8.4 本章小结

参考文献

附表8-1

结论

论文创新点

攻读博士学位期间取得的学术成果

致谢

附录1 氨基酸的简写符号

附录2 英文缩写与中文名称对照

发布时间: 2006-07-20

参考文献

  • [1].C-反应蛋白的胞内折叠组装[D]. 吕建敏.兰州大学2018
  • [2].嗜热自养甲烷杆菌的分离纯化和二硫键异构酶(MTH1745)的分子结构和功能研究[D]. 丁霞.浙江大学2008
  • [3].二硫键异构酶类蛋白在植物响应汞胁迫中的作用[D]. 陈珍.浙江大学2013
  • [4].菌丝霉素的异源表达、抑菌机理及其构效关系研究[D]. 杨雅麟.中国农业科学院2009
  • [5].植酸酶PHYA的高效表达及二硫键的功能分析[D]. 王敏.山东农业大学2008
  • [6].基于计算智能技术的蛋白质结构预测方法研究[D]. 孙鹏飞.哈尔滨工程大学2010
  • [7].硫化氢促血管新生机制研究[D]. 刘姝媛.复旦大学2012
  • [8].Lysinibacillus sphaericus G10 NAD (P)+ 依赖型葡萄糖脱氢酶的研究[D]. 丁海涛.浙江大学2010
  • [9].TNF-α对脂联素多聚化修饰及分泌调控的研究[D]. 何奕多.华中农业大学2015
  • [10].C-反应蛋白结构/功能的氧还调控机制[D]. 王铭裕.兰州大学2012

相关论文

  • [1].生物信息学中的序列比对算法研究[D]. 唐玉荣.中国农业大学2004
  • [2].蛋白质二级结构预测的模型与方法研究[D]. 王勇献.国防科学技术大学2004
  • [3].生物信息学中多序列比对等算法的研究[D]. 张敏.大连理工大学2005
  • [4].α-淀粉酶性能与结构关系的生物信息学研究[D]. 张革新.江南大学2005
  • [5].基于蛋白质序列和生物医学文献的蛋白质功能挖掘[D]. 俞晓晶.中国科学院研究生院(上海生命科学研究院)2006
  • [6].生物信息学中的多序列比对与模体识别问题研究[D]. 刘立芳.西安电子科技大学2006

标签:;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  

蛋白质二硫键结构特征与序列关系的生物信息学研究
下载Doc文档

猜你喜欢