用决策树方法预测酵母蛋白质复合物

用决策树方法预测酵母蛋白质复合物

论文摘要

生物信息学是运用信息学手段对生物数据进行整理、分析和提取的一门新兴交叉学科,蛋白质组学的研究是其中非常重要的方面。而计算机科学中的数据挖掘技术是对大量数据进行分析的一个行之有效的手段。本文将数据挖掘技术中被广泛使用的决策树方法运用到蛋白质组学的研究中,在搜集的大量关于模式生物酿酒酵母的原始数据基础上,用决策树方法对任意一对酿酒酵母蛋白是否构成蛋白质复合物进行预测。在单棵决策树的基础上本文构造了由多棵独立的决策树所组成的决策林(Decision Forest)系统,本文还利用已有的软件包生成了支持向量机(Support Vector Machine: SVM)系统,用同样的训练数据构造上述三种系统并对同样的测试数据进行分类预测,将三种方法的预测结果进行了比较和分析。最后本文对预测结果从生物学意义进行分析,阐述了这个方法对于酵母蛋白质复合物的进一步研究所具有的理论价值。本文主要采用JAVA语言实现了全部的自动批量预测程序,经过实验证明,本文所采用的决策树方法在预测酵母蛋白质复合物上具有比较高的准确率,为酵母蛋白质复合物的进一步研究提供了实用工具,其结果也为进一步生物学研究提供了思路和方向,本文的工作是对于数据挖掘技术在生物信息学领域中应用的一次有益探索。

论文目录

  • 用决策树方法预测酵母蛋白质复合物
  • PREDICTING YEAST PROTEIN COMPLEX USING DECISION TREE
  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 论文研究的背景
  • 1.2 论文的主要内容和章节安排
  • 第二章 背景知识
  • 2.1 生物信息学简介
  • 2.2 数据挖掘技术简介
  • 2.2.1 数据挖掘任务、步骤、方法和对象
  • 2.2.2 归纳学习
  • 2.3 生物信息学与数据挖掘技术的结合
  • 第三章 系统整体框架介绍
  • 3.1 系统整体框架
  • 第四章 酵母原始数据搜集
  • 4.1 酵母数据搜集
  • 4.2 酵母属性数据说明
  • 4.3 酵母属性数据处理
  • 4.4 数据库表结构设计
  • 第五章决策树训练生成
  • 5.1 决策树介绍
  • 5.2 训练数据和测试数据的生成
  • 5.3 决策树的训练生成
  • 5.4 决策树分类预测结果及其分析
  • 第六章决策林及支持向量机的构造
  • 6.1 决策林介绍
  • 6.2 决策林的训练生成
  • 6.3 决策林分类预测结果及其分析
  • 6.4 支持向量机介绍
  • 6.5 支持向量机的训练生成以及分类预测结果
  • 第七章三种分类方法的比较和生物学意义分析
  • 7.1 三种方法比较
  • 7.2 生物学意义分析
  • 第八章 总结和展望
  • 8.1 总结
  • 8.2 本文的创新点
  • 8.3 今后的工作
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的论文和科研项目
  • 附录1 系统表结构设计
  • 附录2 C4.5 决策树例子
  • 论文独创性声明
  • 论文使用授权声明
  • 相关论文文献

    • [1].考虑资金时间价值的工程经济决策树方法[J]. 中国水运(下半月刊) 2011(03)
    • [2].决策树方法使用中的改进策略[J]. 科技信息 2010(08)
    • [3].数据挖掘中决策树方法的研究[J]. 计算机与现代化 2009(10)
    • [4].决策树方法的研究进展[J]. 科技视界 2014(20)
    • [5].决策树方法在野战油库选址评价中的应用研究[J]. 中国储运 2009(12)
    • [6].用决策树方法进行监理项目投标的决策分析[J]. 水电站设计 2008(04)
    • [7].决策树方法在网球训练中的应用[J]. 电脑知识与技术 2014(22)
    • [8].基于决策树方法的数据挖掘分析[J]. 华南金融电脑 2009(08)
    • [9].决策树方法在上市公司成长性预测中的应用研究[J]. 山西财经大学学报 2008(S2)
    • [10].基于决策树方法的信息价值求解方法[J]. 统计与决策 2010(22)
    • [11].基于决策树方法的学生成绩分析应用[J]. 信息通信 2017(01)
    • [12].利用决策树方法识别复杂碳酸盐岩岩性——以苏里格气田苏东41-33区块为例[J]. 油气地质与采收率 2017(06)
    • [13].基于决策树方法的海岛土地利用分类研究[J]. 国土资源遥感 2012(02)
    • [14].基于决策树方法的专利被引影响因素研究[J]. 情报理论与实践 2015(02)
    • [15].基于决策树方法的云南省森林分类研究[J]. 遥感技术与应用 2014(05)
    • [16].决策树方法在学生成绩分析中的应用[J]. 通化师范学院学报 2008(10)
    • [17].全局决策树方法在核电站人员可靠性分析中的应用研究[J]. 核科学与工程 2008(03)
    • [18].基于决策树方法的糖尿病并发症分类研究[J]. 江西中医学院学报 2013(04)
    • [19].基于加权约束的决策树方法在贫困生认定中的应用研究[J]. 计算机应用与软件 2014(12)
    • [20].民族志决策树方法在学术博客用户行为中的研究——以科学网博客为例[J]. 现代图书情报技术 2014(01)
    • [21].决策树方法的大规模资源分配问题[J]. 火力与指挥控制 2008(06)
    • [22].基于SAS的决策树方法应用综述[J]. 时代金融 2017(29)
    • [23].玉树地区融合决策树方法的面向对象植被分类[J]. 草业学报 2013(05)
    • [24].数据挖掘中决策树的探讨[J]. 科技创业家 2013(17)
    • [25].样本分解交汇图法与决策树方法识别苏丹某油田流体性质[J]. 科技导报 2012(02)
    • [26].决策树方法在药物选择模型中的应用[J]. 大众科技 2013(12)
    • [27].基于决策树方法的蒙古高原土地覆盖遥感分类——以蒙古国中央省为例[J]. 地球信息科学学报 2014(03)
    • [28].基于改进的ID3算法生成决策树方法(英文)[J]. 中国通信 2011(05)
    • [29].决策树方法在恶意DLL文件检测中的应用[J]. 计算机系统应用 2009(03)
    • [30].基于高分一号影像光谱指数识别火烧迹地的决策树方法[J]. 林业资源管理 2015(04)

    标签:;  ;  ;  ;  ;  

    用决策树方法预测酵母蛋白质复合物
    下载Doc文档

    猜你喜欢