统计模拟肽及蛋白质的性质和活性

统计模拟肽及蛋白质的性质和活性

论文摘要

定量构效关系(quantitative structure-activity relationship, QSAR)采用数学模型,来描述分子生物学活性和结构间的定量依赖关系。肽是维持生命过程必不可少的物质,而且因其具有高活性、高选择性以及副作用小等特点,现已成为药物研究的热点内容之一。蛋白质的结构功能研究是分子生物学的核心内容之一,解决该问题不仅具有非常重要的理论意义,且对生物技术的发展也拥有非常重要的实践意义。本文研究了肽及蛋白质的结构与活性之间的关系,得到了以下结论:(1)从启发式方法入手,对168个血管紧张素转化酶(angiotensin converting enzyme, ACE)抑制二肽和141个抑制三肽、48个苦味二肽和52个苦味三肽构建QSAR模型,并从训练集内检验和测试集外检验分析了模型的模拟和预测能力。分别用启发式方法对168个ACE抑制二肽和141个ACE抑制三肽构建QSAR模型,去除离群点后,得到优化后的165个ACE抑制二肽和131个ACE抑制三肽样本。分别对优化后的样本随机选择训练集和测试集。训练集建立的QSAR模型优于或者大致与文献结果相当。对于二肽,当N端残基为Gly、Ala、Leu、Val、Tyr与Asp, C端为Tyr、Pro与Trp时,ACE抑制肽的活性较强;对于三肽,当N端残基为Leu、Val、Ile与Gly, C端为Pro、Leu与Tyr时,ACE抑制肽的活性较强。用测试集外部检验模型,均有较好的预测能力。同时预测并验证ACE抑制肽的活性,结果令人满意。对48个苦味二肽和52个苦味三肽随机选择训练集和测试集,分别用启发式方法对训练集构建QSAR模型,所得结果优于或者大致与文献相当。分析模型描述符,表明带有苯丙氨酸F、酪氨酸Y和色氨酸W等疏水性氨基酸序列的苦味多肽可能具有较高的生物活性。这与苦味多肽的苦味由其中的疏水性氨基酸引起的相一致。在研究样本中,苦味多肽WW、IW、LW、FF、FY、FL、YPF、YYY与FFF等集中表现出了较高的活性。用测试集外部检验模型,均有较好的预测能力。由此可见,通过启发式方法建立的多肽QSAR模型均有较好的模拟和预测能力,可以应用于更多预测新的多肽的生物活性研究。(2)从天然氨基酸的50个性质参数中经主成分分析得到8个显著主成分,即一种新的氨基酸描述子:氨基酸特征性质得分(principal component scores of amino acid character properties, SACP)。并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了一种新的蛋白质序列表征方法:核序列自相关函数(kernel sequence auto-correlation function, KSACF)。采用该函数对632个已知晶体结构的非同源蛋白分类研究结果表明:KSACF对内部训练集和外部测试集的模拟和预测能力都达到甚至超过了当前主流蛋白质结构预测方法的整体性能,并且能够恰当提取蛋白质一级序列特征以及氨基酸残基之间隐含的内在联系,从而对不同蛋白质结构类进行准确预测。由此可见,KSACF在蛋白质结构预测及序列分析中具有可喜的应用前景。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 定量构效关系研究进展
  • 1.1.1 定量构效关系发展概述
  • 1.1.2 定量构效关系特点与展望
  • 1.2 肽的定量构效关系研究进展
  • 1.2.1 肽的定量构效关系研究概述
  • 1.2.2 肽的定量构效关系研究面临的挑战
  • 1.3 蛋白质结构和功能预测研究进展
  • 1.4 本文主要研究内容
  • 参考文献
  • 第2章 定量构效关系建模方法与技术
  • 2.1 建模方法与技术
  • 2.1.1 多元线性回归
  • 2.1.2 主成分分析
  • 2.1.3 偏最小二乘回归
  • 2.1.4 启发式方法
  • 2.1.5 支持向量基
  • 2.2 模型的评价
  • 2.2.1 几个重要的模型评价统计量
  • 2.2.2 模型的验证
  • 参考文献
  • 第3章 血管紧张素转化酶抑制肽的定量构效关系研究
  • 3.1 ACE抑制二肽的定量构效关系研究
  • 3.1.1 数据来源
  • 3.1.2 分子结构优化及量子化学参数计算
  • 3.1.3 数据处理
  • 3.1.4 结果和讨论
  • 3.2 ACE抑制三肽的定量构效关系研究
  • 3.2.1 数据来源
  • 3.2.2 分子结构优化及量子化学参数计算
  • 3.2.3 数据处理
  • 3.2.4 结果和讨论
  • 3.3 本章小结
  • 参考文献
  • 第4章 苦味多肽的定量构效关系研究
  • 4.1 苦味二肽的定量构效关系研究
  • 4.1.1 数据来源
  • 4.1.2 分子结构优化及量子化学参数计算
  • 4.1.3 数据处理
  • 4.1.4 结果和讨论
  • 4.2 苦味三肽的定量构效关系研究
  • 4.2.1 数据来源
  • 4.2.2 分子结构优化及量子化学参数计算
  • 4.2.3 数据处理
  • 4.2.4 结果和讨论
  • 4.3 本章小结
  • 参考文献
  • 第5章 一种新的核序列自相关函数用于非同源蛋白质结构类预测
  • 5.1 原理和方法
  • 5.1.1 氨基酸性质特征得分
  • 5.1.2 核序列自相关函数
  • 5.1.3 判别方法
  • 5.2 蛋白质数据集
  • 5.3 结果和分析
  • 5.4 结论
  • 参考文献
  • 第6章 总结与展望
  • 6.1 研究总结
  • 6.2 前景展望
  • 攻读硕士学位期间的主要研究成果
  • 致谢
  • 相关论文文献

    • [1].不同菌种发酵水豆豉风味多肽的差异[J]. 贵州农业科学 2017(01)
    • [2].炖煮鸡汤中多肽与鲜味构效关系[J]. 食品科学 2016(03)
    • [3].土杂全鸡酶水解工艺条件的研究[J]. 食品与发酵科技 2009(02)
    • [4].高温花生粕酶法制备低苦味多肽的研究[J]. 中国油脂 2008(05)

    标签:;  ;  ;  ;  ;  

    统计模拟肽及蛋白质的性质和活性
    下载Doc文档

    猜你喜欢