基于柔性神经树及其集成的蛋白质三级结构预测

基于柔性神经树及其集成的蛋白质三级结构预测

论文摘要

随着结构基因组的出现,通过结构进行生物功能预测已经发展成为结构生物学和生物信息学的主要目的之一。蛋白质的功能大体由它的三级结构决定的。研究蛋白质的结构有非常重要的意义,可以有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,了解蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。因此了解蛋白质的三级结构是了解其功能的前提。本文系统的介绍了蛋白质三级结构、蛋白质表示方法、柔性神经树以及集成学习的基本理论,在总结前人研究的基础上,提出了使用柔性神经树及其集成预测蛋白质三级结构,其中采用多表达式编程算法对柔性神经树树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。集成学习采用了纠错输出编码,并且详细的对纠错输出编码的基本原理和结果决策方法进行了阐述,将多分类问题巧妙的转化成两分类问题,从而达到较好的预测结果。本文使用柔性神经树预测蛋白质三级结构主要分为三个阶段:蛋白质特征提取、建立预测模型和集成学习。(1)蛋白质特征提取。为了方便计算机更好的处理数据,首先要对蛋白质进行特征提取,即将蛋白质的氨基酸残基序列转化为输入空间向量的过程,也称为编码过程。特征的选取对于预测结果非常重要,目前常用的表示蛋白质特征的方法有主要有氨基酸组成模型(AA)、多肽组成模型、伪氨基酸组成(PseAA)、疏水模式等。本文重点运用伪氨基酸组成作为输入特征,并结合其它特征进行特征融合。实验表明使用伪氨基酸组成和其他特征的融合取得了较好的预测精度。(2)建立预测模型。柔性神经树克服了其它非线性模型存在的速度慢、网络结构不易调整等缺陷,具有以下优点:不需要事先设计网络的输入、输出和网络结构,柔性神经树模型可以自动的设计和优化网络结构和参数;各层之间的连接不必是完全的,允许跨层之间的连接;柔性神经树的进化结果通常要比一般神经网络结构简单、泛化推广效果好;本文选用柔性神经树作为预测模型,其中采用多表达式编程算法对柔性神经树结构进行优化,模型中各个参数采用粒子群优化算法进行优化。(3)为了进一步提高分类器的性能,最后将分类器进行集成学习。通过使用数据集C204和640进行结果验证表明集成学习对最后的预测精度有很大的提高。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 相关知识背景
  • 1.2 蛋白质结构的重要性
  • 1.3 论文内容安排
  • 第二章 蛋白质三级结构预测
  • 2.1 蛋白质相关知识及其三级结构概述
  • 2.1.1 蛋白质相关知识
  • 2.1.2 蛋白质三级结构概述
  • 2.2 蛋白质三级结构预测方法
  • 2.2.1 比较建模法
  • 2.2.2 从头预测方法
  • 2.2.3 折叠模式识别
  • 2.3 应用于生物信息学领域的机器学习方法
  • 2.3.1 神经网络
  • 2.3.2 贝叶斯网络
  • 2.3.3 隐马尔可夫模型
  • 2.3.4 支持向量机
  • 第三章 柔性神经树及其理论基础
  • 3.1 概述
  • 3.2 编码规则
  • 3.3 适应值函数
  • 3.4 参数优化
  • 3.4.1 多表达式编程
  • 3.4.2 粒子群优化算法
  • 3.4.3 多表达式编程算法和粒子群优化算法的优点
  • 3.5 柔性神经树算法流程
  • 第四章 集成学习
  • 4.1 集成学习的概念
  • 4.2 基本分类器的构造
  • 4.2.1 处理训练数据集
  • 4.2.2 对输入特征进行处理
  • 4.2.3 通过处理类标号
  • 4.2.4 通过处理学习算法
  • 4.3 分类器集成方法
  • 4.4 集成方法的性能
  • 第五章 预测模型设计与结果分析
  • 5.1 引言
  • 5.2 数据集
  • 5.2.1 C204 数据集
  • 5.2.2 25PDB 数据集
  • 5.2.3 640 数据集
  • 5.2.4 1189 数据集
  • 5.3 编码规则与分类方法
  • 5.3.1 考虑顺序的编码方法
  • 5.3.2 不考虑顺序的编码方法
  • 5.3.3 多分类问题
  • 5.4 柔性神经树预测蛋白质三级结构
  • 5.4.1 实验设计
  • 5.4.2 结果分析
  • 5.5 集成柔性神经树预测蛋白质三级结构
  • 5.5.1 集成柔性神经树设计
  • 5.5.2 结果分析
  • 第六章 总结与展望
  • 6.1 全文总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 附录
  • 一、在校期间发表的学术论文
  • 二、在校期间获奖情况
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于柔性神经树及其集成的蛋白质三级结构预测
    下载Doc文档

    猜你喜欢