基于计算智能算法的蛋白质温热性识别研究

基于计算智能算法的蛋白质温热性识别研究

论文摘要

因为蛋白质在高温或极端PH值的环境下非常容易失去活性,这就造成了在一些极端环境中进行蛋白质的大规模的生产应用困难的局面,为此,蛋白质在极端条件下的热稳定表象成为了生物物理和生物技术领域的热点研究论题,那么如何高效的区分酶的热稳定差异并提高其热稳定性一直是各方科研力量尤其是生物科学研究者和化学化工研究者所积极从事的重要研究课题之一。尤其是我们积极探明的蛋白质的热稳定性是否可以在一级氨基酸序列水平上进行高效快速的检测变得尤为迫切。因为蛋白质的氨基酸序列决定其应有的结构,而其结构决定了其表现出的性质,所以蛋白质一级序列中含有的信息已经足够用来预测蛋白质的热稳定性了,并且这种方法也应用到蛋白质研究的其他应用领域,具有较好的通用性。从分子生物学、结构生物学的角度出发,氨基酸组成(AA)、二肽组成以及类似于氢键,疏水性等蛋白质的物理化学性质都是影响蛋白质热稳定性的因素。本文试图从蛋白质一级序列出发,利用这些影响耐热的因素并结合计算智能算法对嗜热和常温蛋白进行识别。如果蛋白质的热稳定性能通过其一级序列进行识别,就可以设计一种基于计算机的筛选方法。借助计算机的高速运算能力,显著提高寻找热稳定性很好的蛋白质的几率,并预测未知来源的蛋白质序列的热稳定性。蛋白质温热性识别问题从本质上来说是机器学习领域经典的监督学习两分类问题,即判断未知蛋白是嗜热蛋白或常温蛋白两类中的哪一类,因此蛋白质温热性识别问题需要集中解决以下两个方面的问题:如何有效地从蛋白质原始的氨基酸序列中提取特征并进行必要的特征选择。这就是通常所说的蛋白质特征提取。之所以要进行特征提取,是因为从数据库中获取的蛋白质是由20个字母组成的长短不一的氨基酸序列,把序列直接作为预测模型的输入进行计算是不现实的,这就需要将氨基酸的字母序列转换成能够被计算机识别的数字序列,也就是进行特征提取,因此特征提取方法的合适与否在很大程度上影响着课题的预测精度。在本文中,首先尝试了多特征融合实验,因为氨基酸组成是影响酶耐热性的主要因素之一,故在氨基酸组成特征提取算法的基础上融入理化性质(chemcomposition)进而进行蛋白质特征提取,并使用神经网络进行分类识别,较之单一的特征提取方式取得了不错的结果。另一方面,本文将改进的伪氨基酸特征提取方法引入到蛋白质温热性识别研究中,因为蛋白质的热稳定性与其诸多的物理化学性质有关,而伪氨基酸组成这一特征提取方法仅仅融入了氨基酸的疏水性、亲水性和侧链原子量三种物理化学性质,故将Z标度引入到伪氨基酸组成中取代原有的氨基酸的疏水性、亲水性和侧链原子量。Z标度(z-scales)是Hellberg等对氨基酸的29个物理化学性质进行主成分分析,得到的3个显著主成分,并将相应主成分得分矢量作为新的氨基酸描述子。如何根据提取的特征建立有效的分类预测模型。在本文中选用粒子群算法优化的神经网络(PSO-NN)作为分类器,并尝试运用基于遗传算法的选择性集成策略(GASEN)进行集成研究,都取得了不错的结果。另外首次将柔性神经树(FNT)作为分类器并结合改进的伪氨基酸特征提取方法进行蛋白质温热性识别。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 蛋白质温热性识别的研究背景和意义
  • 1.3 蛋白质温热性识别的生物基础知识
  • 1.3.1 常温嗜热蛋白的概念及特性
  • 1.3.2 嗜热蛋白的耐热机制
  • 1.4 计算智能技术综述
  • 1.5 研究方案和主要工作
  • 第二章 数据集及分类系统的性能评价
  • 2.1 数据集的建立、划分
  • 2.1.1 蛋白质序列数据库介绍
  • 2.1.2 实验所用数据集的创立及划分
  • 2.2 分类系统性能度量指标
  • 2.2.1 评价方法
  • 2.2.2 性能评价指标
  • 第三章 基于神经网络的蛋白质温热性识别
  • 3.1 实验采用的特征提取方法
  • 3.2 分类模型-人工神经网络
  • 3.2.1 神经网络综述
  • 3.2.2 神经网络的设计
  • 3.2.3 神经网络的参数优化算法
  • 3.3 基于粒子群算法优化的神经网络的蛋白质温热性识别
  • 3.4 结果与讨论
  • 第四章 基于集成神经网络的蛋白质温热性识别
  • 4.1 集成学习概述
  • 4.2 一种基于集成神经网络的蛋白质温热性识别
  • 4.3 结果与讨论
  • 第五章 基于改进的伪氨基酸特征提取方法和柔性神经树的蛋白质温热性识别
  • 5.1 改进的伪氨基酸特征提取方法
  • 5.2 柔性神经树
  • 5.2.1 编码规则
  • 5.2.2 适应值函数
  • 5.2.3 参数优化算法
  • 5.3 实验设计和结果
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 附录
  • 相关论文文献

    • [1].高热性猪病的治疗与防治[J]. 农村科学实验 2017(05)
    • [2].谈谈物质的导热性和导热方式[J]. 初中生世界(初二物理版) 2009(Z2)
    • [3].热性痉挛会不会养成毛病[J]. 健康生活 2010(01)
    • [4].物质的导热性[J]. 初中生世界(初二物理版) 2008(Z1)
    • [5].不同倾角太阳能热水器北京地区热性能试验研究[J]. 太阳能 2013(24)
    • [6].“物质的特性”趣谈[J]. 初中生世界(八年级物理) 2013(Z1)
    • [7].导热性强的公司吃不开了[J]. 商学院 2014(10)
    • [8].此法治疗猪高热性腹泻有特效[J]. 北方牧业 2009(10)
    • [9].影响焦炭热性能实验因素探析[J]. 包钢科技 2015(04)
    • [10].焦炭气孔率对焦炭热性能的影响[J]. 燃料与化工 2011(05)
    • [11].导热性半固化片的研制及应用[J]. 覆铜板资讯 2011(05)
    • [12].焦炭热性能影响因素分析[J]. 煤炭科学技术 2008(05)
    • [13].浅谈高热性猪病诊疗和防制对策[J]. 中国畜禽种业 2019(05)
    • [14].关于焦炭热性能影响因素的研究[J]. 化工管理 2017(06)
    • [15].高热性猪病的诊疗与防治对策[J]. 乡村科技 2017(21)
    • [16].嗜热性侧孢霉生物菌肥在葡萄栽培上的应用研究[J]. 河北林业科技 2016(01)
    • [17].耐火浇注料导热性评估方法的比较[J]. 耐火与石灰 2016(05)
    • [18].矿物质对焦炭热性能影响的研究及应用[J]. 河南冶金 2014(06)
    • [19].纺织品遮热性能的表征及其评价[J]. 印染 2018(06)
    • [20].白腐真菌与嗜热性侧孢霉对棉秆的降解效果初探[J]. 中国棉花 2014(09)
    • [21].芴环结构对聚碳酸酯热性能的改进[J]. 塑料 2011(04)
    • [22].Bi_2O_3-ZnO-B_2O_3系玻璃形成区与热性能的研究[J]. 武汉理工大学学报 2010(22)
    • [23].磁场作用下的磁流变液导电性和导热性[J]. 华南理工大学学报(自然科学版) 2014(10)
    • [24].碳纳米管增强银复合材料的导热性(英文)[J]. Transactions of Nonferrous Metals Society of China 2015(01)
    • [25].葡萄干是热性还是凉性[J]. 保健文汇 2018(11)
    • [26].玻璃纤维/环氧树脂复合材料的热性能[J]. 纤维复合材料 2011(02)
    • [27].废弃膨胀聚丙烯基骨料对轻质混凝土力学和热性能的影响研究[J]. 新型建筑材料 2020(06)
    • [28].如何区分寒性和热性食物[J]. 人人健康 2012(23)
    • [29].废旧纤维制备蜂窝夹层复合材料的导热性研究[J]. 纤维复合材料 2014(01)
    • [30].石蜡基相变材料导热性和液相渗漏研究进展[J]. 化工新型材料 2013(01)

    标签:;  ;  ;  ;  ;  

    基于计算智能算法的蛋白质温热性识别研究
    下载Doc文档

    猜你喜欢