文献计量学和文本挖掘在生命科学中的应用

文献计量学和文本挖掘在生命科学中的应用

论文摘要

在过去的十几年中,随着生物医学科学技术的飞速发展,生物医学文献也呈“指数型”增长。面对如此大规模快速增长的文献数据,仅靠人工阅读的方式去获取感兴趣的知识已变得非常困难。如何从海量的文献中整合已有知识、挖掘新知识已成为生物信息学的重要研究领域。本文首先对PubMed收录的所有与疾病相关的基础研究文献进行文献计量学分析,了解国际上各类疾病基础研究的发展状况、研究热点、核心期刊、核心科研机构、主要研究国家及今后的发展趋势等。对21大类疾病的统计结果表明各大类疾病的基础研究文献都是从1946年左右开始缓慢上升,2000年后增长速度明显加快;主要研究国家和核心科研机构多分布在北美洲、欧洲和亚洲;文献的发表量普遍与国家的国内生产总值相关。然后,论文整合了一种从海量文献中提取疾病相关基因的方法,将前人已研究过的基于单体的实验信息整和起来,以更为系统和全面的眼光来看待生物体内在分子水平上的相互作用及其调控路径对于疾病发生、发展及预后的影响。通过对前列腺癌相关基因的提取结果进行分析,表明该方法确实可以快速、有效地提取疾病的相关基因。利用这种方法,本文从海量的生物医学文献中提取二十一大类疾病的相关基因。最后,本文利用Google Maps API及PHP+Apache+MySQL技术,搭建了疾病基础研究地理信息系统,将二十一大类疾病的文献计量和文本挖掘的结果整合到该系统平台中,为生物医学工作者提供疾病基础研究的一些思路和依据。

论文目录

  • 中文摘要
  • Abstract
  • 第一章 绪论
  • 1.1 引言
  • 1.2 文献计量学及其研究现状
  • 1.3 文本挖掘及其在生物信息中的应用
  • 1.3.1 实体识别
  • 1.3.2 信息提取
  • 1.4 课题拟解决的问题
  • 1.5 本文的主要内容及组织结构
  • 第二章 数据的获取与整理
  • 2.1 数据来源
  • 2.2 数据获取
  • 2.2.1 eUtils 简介
  • 2.2.2 获取方法
  • 2.3 筛选分类
  • 2.3.1 数据预处理
  • 2.3.2 疾病名称表的构建
  • 2.3.3 各类疾病相关基础研究文献的筛选
  • 2.4 本章小结
  • 第三章 基于文献计量学的疾病基础研究状况分析
  • 3.1 文献计量学方法与分析类目的选择
  • 3.2 结果统计分析
  • 3.2.1 文献量随时间变化情况
  • 3.2.2 研究热点分析
  • 3.2.3 核心期刊
  • 3.2.4 地域分布
  • 3.2.5 核心科研机构
  • 3.2.6 国家科研实力分析
  • 3.2.7 文献数与国内生产总值的关系分析
  • 3.4 本章小结
  • 第四章 基于文本挖掘的疾病相关基因研究
  • 4.1 疾病相关基因的提取方法
  • 4.1.1 文献数据预处理
  • 4.1.2 候选语句筛选
  • 4.1.3 基因-疾病关系提取
  • 4.1.4 疾病相关基因对应蛋白相互作用网络的建立
  • 4.1.5 对蛋白相互作用网络的中心结点进行GO 分析
  • 4.1.6 疾病相关基因在KEGG 通路中的富集度分析
  • 4.2 前列腺癌相关基因的提取分析
  • 4.2.1 前列腺癌相关基因的提取结果
  • 4.2.2 前列腺癌相关基因对应蛋白的相互作用网络的构建与分析
  • 4.2.3 前列腺癌相关基因在KEGG 通路中的富集度分析
  • 4.2.4 与Hub 蛋白相互作用的蛋白质的GO 富集度分析
  • 4.3 二十一大类疾病相关基因的提取
  • 4.4 本章小结
  • 第五章 基于Google Maps API 的疾病基础研究地理信息系统的构建
  • 5.1 Google Maps API 简介
  • 5.2 开发环境与关键技术
  • 5.2.1 主体框架
  • 5.2.2 数据来源
  • 5.2.3 数据库结构设计
  • 5.2.4 地图加载和显示
  • 5.3 疾病基础研究地理信息平台的实现与使用
  • 5.3.1 文献计量模块
  • 5.3.2 核心科研机构模块
  • 5.3.3 国家研究实力分析模块
  • 5.3.4 疾病相关基因查询模块
  • 5.3.5 基因相关疾病查询模块
  • 5.4 本章小结
  • 第六章 总结与展望
  • 缩略词表
  • 参考文献
  • 攻读硕士期间发表的文章
  • 致谢
  • 相关论文文献

    • [1].中国老年慢性阻塞性肺疾病患者院外肺康复的文献计量学[J]. 中国老年学杂志 2020(04)
    • [2].基于文献计量学的山茱萸研究现状分析[J]. 现代农业科技 2020(06)
    • [3].国际近15年太极拳研究的文献计量及可视化分析[J]. 中国康复医学杂志 2020(03)
    • [4].基于文献计量角度的阅读疗法研究综述[J]. 办公室业务 2020(04)
    • [5].文献计量学评价在医学领域科研管理决策中的应用[J]. 图书馆界 2020(01)
    • [6].我国知识产权研究现状分析——基于文献计量学的视角[J]. 南方农机 2020(11)
    • [7].基于文献计量的玉米逆境胁迫机制研究进展分析[J]. 农业大数据学报 2020(02)
    • [8].十二五以来我国体育产业发展热点追踪——基于文献计量的分析[J]. 甘肃科技 2020(16)
    • [9].基于文献计量可视化方法的国内批评话语分析现状研究[J]. 考试与评价(大学英语教研版) 2020(04)
    • [10].核心素养研究的文献计量探讨[J]. 长春教育学院学报 2020(06)
    • [11].继奠基之功业,续计量之创新——品邱均平先生《文献计量学》(第二版)[J]. 情报科学 2020(09)
    • [12].基于2014—2019年CSSCI文献计量的中国精准扶贫研究态势分析[J]. 农业科技管理 2020(05)
    • [13].我国文献计量学研究40年——基于知识图谱的回顾与展望[J]. 信息与管理研究 2020(Z2)
    • [14].我国“民主党派”专题研究现状分析——基于文献计量学的分析[J]. 科技文献信息管理 2019(01)
    • [15].中国应急科学知识与技术文献计量及应用对策[J]. 科技导报 2019(16)
    • [16].文献计量在科研评估中的问题与校正探讨[J]. 现代情报 2018(01)
    • [17].我国“弱势群体”研究现状分析——基于文献计量学的分析[J]. 科技文献信息管理 2018(01)
    • [18].图书馆与家庭阅读推广文献计量分析[J]. 兰台世界 2018(06)
    • [19].基于文献计量的图书馆扶贫研究分析评价[J]. 晋图学刊 2018(05)
    • [20].基于文献计量学的国内标准档案研究分析[J]. 标准科学 2017(01)
    • [21].文献计量学对护理科研人员启示[J]. 世界最新医学信息文摘 2017(08)
    • [22].2016年国外学术评价研究——基于文献计量学视角[J]. 国外社会科学 2017(02)
    • [23].基于文献计量学的单独温和灸治疗的优势病种[J]. 全科护理 2017(19)
    • [24].灰树花生物活性研究的文献计量学及可视化分析[J]. 西北民族大学学报(自然科学版) 2017(01)
    • [25].文献计量学对文献整理的作用与展望(摘要)[J]. 上海高校图书情报工作研究 2017(02)
    • [26].基于文献计量学的网络教学平台在高校教学中的应用研究[J]. 赤峰学院学报(自然科学版) 2017(21)
    • [27].基于文献计量学的国内青铜器研究文献综述[J]. 铸造技术 2016(01)
    • [28].我国现阶段“网络文明”研究的基本特点——基于文献计量学的分析[J]. 江西青年职业学院学报 2016(01)
    • [29].文献计量学在图书馆业务中的应用现状与前景[J]. 河南图书馆学刊 2016(03)
    • [30].基于文献计量学的丹皮酚研究领域全景分析[J]. 中国中医基础医学杂志 2016(05)

    标签:;  ;  ;  ;  

    文献计量学和文本挖掘在生命科学中的应用
    下载Doc文档

    猜你喜欢