数据挖掘在分子系统发生与定量构效关系建模中的应用

数据挖掘在分子系统发生与定量构效关系建模中的应用

论文摘要

随着存储技术和Internet的迅猛发展,各行业数据量急剧增多,迫切需求更强有力的工具来“挖掘”有用信息,数据挖掘技术应运而生,目前已在各个领域获得广泛地应用。本文从数据挖掘无监督学习(聚类-以分子系统发生分析为例)和有监督学习(预测-以化合物定量构效关系建模为例)两个方面进行了研究。提取物种信息特征是分子系统发生分析的关键。本文提出新的信息特征提取方法—多尺度步长关联法,建立了一种新的、不需要序列联配的分子系统发生分析方法,分别基于全基因组序列对冠状病毒、基于线粒体全蛋白质组序列对全变态昆虫进行了系统发生分析。基于全基因组的冠状病毒分子系统发生分析结果显示,冠状病毒共分为四大组,SARS冠状病毒形成一个独立的大分支,明显的与其它三组区分开来,且来自蝙蝠的冠状病毒与其它SARS冠状病毒稍有不同,说明蝙蝠有可能为SARS冠状病毒的自然宿主。基于线粒体全蛋白质组序列对全变态昆虫进行分子系统发生分析时,引入了氨基酸的19个物理化学参数,结果与传统方法分类较为吻合,几乎相同科和目的物种都聚在了一起。说明基于物理化学参数的多尺度步长关联在构建全变态昆虫的分子系统发生树时可获得较好的聚类效果。本文发展的多尺度步长关联法有望应用在基于全基因组水平和全蛋白质组水平上的各类分析。第二部分发展了一种新的定量构效关系的预测方法。论文提出了一种基于支持向量机回归和k-最近邻的组合预测方法(SVR-KNN),并将其应用于抗生素的定量构效关系研究。留一法预测结果表明,非线性筛选描述符和子模型能明显提高预测精度,汰选子模型后的组合预测精度优于单一子模型,SVR-KNN的MSE、MAPE分别为0.019、1.81%;独立样本预测结果显示,SVR-KNN在所有参比模型中具有最优的预测精度及稳定性,其MSE、MAPE分别为0.010、1.33%。说明本文提出的SVR-KNN顶测模型具有较强的预测能力和优异的泛化推广能力,在化合物的QSAR研究中有广泛应用前景。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1 选题背景和研究意义
  • 2 分子系统发生研究进展
  • 2.1 分子系统发生研究背景和意义
  • 2.2 分子系统发生分析过程
  • 2.3 基于全基因组的分子系统发生分析
  • 3 定量构效关系研究进展
  • 3.1 定量构效关系常用分子结构描述符
  • 3.2 定量构效关系常用建模方法
  • 4 内容安排和创新点
  • 5 参考文献
  • 第二章 基于全基因组分子系统发生分析
  • 1 引言
  • 2 冠状病毒
  • 3 数据集与方法
  • 3.1 数据集
  • 3.2 方法
  • 4 结果与讨论
  • 4.1 冠状病毒分子系统发生树
  • 4.2 本文方法的优点和局限性
  • 5 结论与展望
  • 6 参考文献
  • 第三章 基于全蛋白质组分子系统发生分析
  • 1 引言
  • 2 数据集与方法
  • 2.1 数据集
  • 2.2 方法
  • 3 结果与讨论
  • 4 结论与展望
  • 5 参考文献
  • 第四章 支持向量机在定量构效关系研究中的应用
  • 1 引言
  • 2 数据集与方法
  • 2.1 数据集
  • 2.2 SVR-KNN建模方法
  • 2.3 算法实现及预测性能评价指标
  • 3 结果
  • 3.1 基于SVR的不同模型留一法预测性能比较
  • 3.2 不同模型独立样本预测性能比较
  • 4 讨论
  • 5 结论与展望
  • 6 参考文献
  • 致谢
  • 作者简历
  • 相关论文文献

    • [1].试验性数据挖掘计划突显定量构效关系问题[J]. 生态毒理学报 2014(05)
    • [2].基于深度学习的溶剂定量构效关系建模研究进展[J]. 化工学报 2020(10)
    • [3].锌螯合肽的两端排序法定量构效关系[J]. 食品科学 2018(21)
    • [4].查尔酮衍生物抗肿瘤活性的定量构效关系研究[J]. 黔南民族医专学报 2019(04)
    • [5].催化剂定量构效关系建模方法应用进展[J]. 计算机与应用化学 2016(10)
    • [6].化学计量学在分析化学中的应用研究[J]. 中国新技术新产品 2016(02)
    • [7].三肽的锌螯合活性及定量构效关系分析[J]. 高等学校化学学报 2018(02)
    • [8].启发式方法研究黄酮类神经氨酸酶抑制剂定量构效关系[J]. 甘肃石油和化工 2013(02)
    • [9].有机氟化合物急性毒性全息定量构效关系[J]. 上海应用技术学院学报(自然科学版) 2015(03)
    • [10].ω-芋螺毒素的定量构效关系与虚拟筛选[J]. 物理化学学报 2014(11)
    • [11].吡唑并[3,4-b]吡啶衍生物对A1腺苷受体拮抗活性的定量构效关系[J]. 宿州学院学报 2016(11)
    • [12].底泥中苯取代化合物的定量构效关系(QSAR)研究[J]. 水资源与水工程学报 2009(01)
    • [13].磷酸二酯酶4b抑制剂定量构效关系及分子对接研究[J]. 化学通报 2020(10)
    • [14].酚类物质臭氧氧化降解的定量构效关系[J]. 环境化学 2015(10)
    • [15].CoMFA,CoMSIA,HQSAR方法研究四氢异喹啉衍生物的定量构效关系[J]. 兰州大学学报(自然科学版) 2009(04)
    • [16].基于定量构效关系预测血管紧张素转化酶抑制剂活性[J]. 重庆工学院学报(自然科学版) 2009(11)
    • [17].定量构效关系在食品分析中的应用[J]. 杭州化工 2015(03)
    • [18].苯胺类化合物生物毒性的定量构效关系研究[J]. 青海大学学报(自然科学版) 2013(04)
    • [19].甲状腺激素受体配体化合物的定量构效关系(QSAR)研究[J]. 分子科学学报 2008(04)
    • [20].脂肪族含氧有机物沸点的定量构效关系[J]. 化工学报 2012(12)
    • [21].化学计量学在分析化学中的应用[J]. 合肥师范学院学报 2014(06)
    • [22].基于支持向量机建立取代苯类化合物毒性预测模型[J]. 毒理学杂志 2011(03)
    • [23].吲唑脲类辣椒素受体通道拮抗剂的定量构效关系[J]. 浙江大学学报(理学版) 2010(02)
    • [24].具有除草活性的大环内酯类衍生物的定量构效关系[J]. 物理化学学报 2010(04)
    • [25].定量构效关系在化学计量学发展中的作用[J]. 化学分析计量 2009(01)
    • [26].基于定量构效关系的药物检测研究[J]. 当代化工 2016(01)
    • [27].基于配体与受体结构的酪氨酸酶抑制剂定量构效关系分析[J]. 应用化学 2018(07)
    • [28].计算机辅助药物设计应用研究[J]. 黑龙江科技信息 2014(32)
    • [29].计算机辅助设计在药物研发中的应用现状探究[J]. 现代养生 2019(24)
    • [30].萜类臭虫(Cimex lectularius L.)驱避化合物的定量构效关系研究(英文)[J]. 林产化学与工业 2012(03)

    标签:;  ;  ;  ;  ;  

    数据挖掘在分子系统发生与定量构效关系建模中的应用
    下载Doc文档

    猜你喜欢