蛋白质组表达谱基本生物信息学研究及全蛋白质组等电点分布研究

蛋白质组表达谱基本生物信息学研究及全蛋白质组等电点分布研究

论文题目: 蛋白质组表达谱基本生物信息学研究及全蛋白质组等电点分布研究

论文类型: 博士论文

论文专业: 细胞生物学

作者: 吴松锋

导师: 贺福初,朱云平

关键词: 蛋白质组学,生物信息学,蛋白质鉴定,质量控制,等电点

文献来源: 中国人民解放军军事医学科学院

发表年度: 2005

论文摘要: 人类基因组研究为我们提供了人类基因组图谱,但基因组图谱所能提供的基因组内蕴含的功能信息非常有限。为了系统阐释其编码基因的功能,以及其间的相互关系等,蛋白质组研究同益受到关注。 蛋白质组研究最根本的目标是建立生物体组织或器官的蛋白质组表达谱,以及随后系统地阐明表达谱的生物学意义。至今,蛋白质组的多种鉴定仪器已经能以较高的通量进行蛋白质鉴定,这些技术为大规模的蛋白质组表达谱研究奠定了基础。然而,与高速发展的仪器相比较,适合于大规模蛋白质组表达谱研究的数据处理、整合及分析方法明显滞后。虽然个别表达谱研究也建立了部分数据处理、整合的方法,但至今仍然没有一个系统、全面的数据处理、整合体系。蛋白质鉴定的可靠性依然是蛋白质质谱鉴定的难点;而且,在质谱产出数据和最终表达谱的系统生物学意义分析之间仍然存在着难以跨越的鸿沟。 为进一步提高蛋白质鉴定的可靠性,并填补蛋白质质谱鉴定和表达谱分析之间的鸿沟,为最终鉴定蛋白质的生物学分析提供便利,我们在对现有研究的充分调研以及对蛋白质组表达谱需求详细分析的基础上,建立了多种策略以加强鉴定结果的可靠性,并为随后的生物学分析提供了鉴定蛋白质的基本注释信息。 对于基因组序列已知的生物,数据库搜索策略是最经济、最有效的蛋白质鉴定疗法。为获得尽可能多高可靠性的鉴定结果,我们采用了分步搜索的策略:首先通过对一个质量相对较高、覆盖率较大的非冗余数据库的搜索完成基本鉴定;其次,为了充分利用质谱数据,我们建立了用其它数据库(包括蛋白质数据库和核酸数据库)进行分步搜索的策略,完成了质谱数据的补充鉴定和新蛋白质挖掘。 出于数据库搜索属于一种模式匹配的策略,所用的质谱鉴定结果往往不是特别精确,而且数据库中也存在大量的相似蛋白质或肽段,有时一个质谱鉴定结果可能匹配不止一个蛋白质或肽段。为了充分利用这些质谱数据,并准确地描述肽段和蛋白质鉴定的不精确性,我们建立了肽段和蛋白质鉴定的Group模型。 对于肽质最指纹谱的结果,针对其数据的特殊性,首先利用统计方法获得样

论文目录:

摘要

Abstract

英文缩写词

前言

第一章.蛋白质鉴定所用搜索数据库的选择及分步搜索策略

1 概述

2 材料与方法

3 结果

3.1 数据库的物种选择

3.1.1 跨物种蛋白质鉴定的可行性

3.1.2 人类蛋白质数据库的不完整性

3.1.3 非人类蛋白质数据对人类蛋白质数据的补充非常有限

3.2 各种人类蛋白质数据库的关系和比较

3.2.1 现有人类蛋白质数据库的关系

3.2.2 人类蛋白质数据库间冗余度和覆盖率比较

3.2.3 人类蛋白质数据库的实际搜索效果比较

3.3 蛋白质鉴定的分步搜索策略

3.3.1 基本鉴定

3.3.2 补充鉴定和新蛋白质挖掘

3.4 蛋白质鉴定策略在胎肝蛋白质组研究中的应用

4 讨论

第二章.蛋白质质谱鉴定结果的质量控制和评估

1 概述

1.1 蛋白质质谱鉴定的基本方法

1.2 蛋白质鉴定的阳性和阴性结果

1.3 串联质谱鉴定结果的质量控制

1.4 PMF蛋白质鉴定结果的质量控制

1.5 鉴定结果可靠性评估

1.6 同一个蛋白质的鉴定肽段数——另外一种独立的指标

1.7 HLPP表达谱研究多种技术路线的质量控制策略

2 材料与方法

2.1 鉴定结果可靠性的评估策略

3 结果

3.1 质谱鉴定结果的Group模型

3.2 MALDI-TOF/TOF的PMF或PMF+PFF类型数据的质量控制

3.2.1 MALDI-TOF/TOF噪音数据的提取

3.2.2 MALDI-TOF/TOF数据处理流程

3.3 Shotgun数据的质量控制

3.4 串联质谱肽段鉴定可靠性评估

4 讨论

第三章.蛋白质组表达谱数据处理、整合及注释体系的构建

1 鉴定的不精确性和蛋白质Group模型

1.1 蛋白质鉴定的Group模型

1.2 鉴定蛋白质Group的获取

2 鉴定结果的整合

3 蛋白质Group内各蛋白质间关系的判断

4 蛋白质组基本数据处理平台

5 蛋白质组基本性质分析

6 鉴定蛋白质的基本注释

7 讨论

蛋白质组表达谱基本生物信息学研究总结

第四章.全蛋白质组等电点的分布

1 概述

2 材料与方法

2.1 材料

2.2 方法

3 结果

3.1 不同物种全基因组编码蛋白质组的等电点分布

3.2 随机蛋白质组呈现相似的等电点多峰分布特征

3.3 等电点多峰分布是由低分子量等电点分布不连续造成的

3.4 极碱区域的等电点峰

3.5 等电点分布偏性证明蛋白质等电点峰和蛋白质亚细胞定位无关

3.6 等电点漂变情况证明蛋白质等电点峰和蛋白质功能无关

4 讨论

附:新报道的研究进展

全文总结

附录

附录1:Group的整合程序处理的一批数据示例

附录2.MALDI-TOF/TOF的高频质量

附录3.MALDI-TOF/TOF数据质量控制处理前后的结果实例

致谢

在读期间发表的论文、摘要列表

在读期间发表论文全文

发布时间: 2005-09-05

相关论文

  • [1].生物质谱新技术及其在疾病蛋白质组研究中的应用[D]. 张国安.复旦大学2003
  • [2].多种蛋白质组学技术策略用于人血清蛋白质组分析的比较研究[D]. 李晓海.中国人民解放军军事医学科学院2004

标签:;  ;  ;  ;  ;  

蛋白质组表达谱基本生物信息学研究及全蛋白质组等电点分布研究
下载Doc文档

猜你喜欢