基于文本挖掘的学科领域相关问题研究

基于文本挖掘的学科领域相关问题研究

论文摘要

在科学技术不断繁荣发展的过程当中,传统的自然科学得以深入细分和发展,新的学科不断产生,学科之间相互渗透融合的趋势逐渐增强,学科发展逐渐趋于综合化、整体化。因此,探究学科整体组成结构,挖掘学科热点,分析学科交叉以及探究学科分化融合的演化趋势,对广大科技工作者把握学科的发展动态,深入开展学科研究,推动学科的协调发展具有非常重要的意义。本文在对学科领域研究相关方法进行比较的基础上,针对基础研究科研项目建议书文本这一特殊语料,选择文本挖掘中的文本分类和文本聚类方法进行了学科领域的划分:从学科代码和学科簇类两个角度对管理科学与工程这一学科领域进行了学科组成及热点识别、学科交叉以及学科演变分析。本文主要工作如下:(1)对学科领域进行划分。通过利用文本分类和文本聚类对建议书语料进行划分,确定了学科领域的外延范围,实现了学科领域的划分。其中文本分类过程运用了剪裁的质心分类算法流程;文本聚类采用了凝聚聚类算法流程。(2)对学科领域进行了组成分析以及热点识别。分别对学科代码和学科簇类进行了组成分析以及热点识别,其中采用文献计量方法识别管理科学与工程学科领域下的热点学科领域,利用关键词分析法重点对知识管理学科领域进行热点问题识别。(3)对学科代码的交叉情况进行了分析。定义了代码清晰度、代码模糊度和代码交叉度三个分析指标,对管理科学与工程学科代码下各个子学科代码进行了指标统计,对学科代码边界的清晰程度、模糊程度和交叉程度进行了整体分析。最后重点对管理系统工程学科代码的交叉情况进行了综合分析,包括交叉程度和交叉研究内容。(4)对学科领域的发展演变进行了分析。定义了演变关系和溯源关系,根据学科簇类最大相似度网络图对2000-2005年中学科簇类之间的分化融合演变趋势进行了分析。利用领域关键词,深入分析学科领域内部研究内容,具体针对知识管理领域,分别从学科代码和学科簇类角度分析了其研究内容的演变趋势。研究结果表明,管理科学与工程学科领域组成较为复杂,其中金融和知识管理等领域为研究热点领域;整体学科交叉程度逐年递增,学科领域边界模糊程度逐年加剧,其分化融合趋势也十分明显。本文的研究成果可以为科研工作者把握学科领域整体势态和发展趋势提供帮助。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 问题的提出及研究意义
  • 1.2 相关研究方法
  • 1.2.1 词频分析法
  • 1.2.2 引文分析法
  • 1.2.3 文本挖掘
  • 1.3 论文主要内容及结构安排
  • 2 研究语料的选择及学科领域的划分
  • 2.1 基础研究科研项目建议书语料
  • 2.2 学科领域划分
  • 2.2.1 学科领域划分的两种方式
  • 2.2.2 文本分类处理及评价
  • 2.2.3 文本聚类处理及评价
  • 2.3 本章小结
  • 3 学科领域组成分析与热点识别
  • 3.1 研究热点识别方法
  • 3.1.1 文献数量统计方法
  • 3.1.2 关键词词频分析法
  • 3.2 学科代码组成分析与热点识别
  • 3.2.1 管理科学与工程学科代码组成分析
  • 3.2.2 学科代码下热点领域识别
  • 3.2.3 知识管理学科代码热点问题识别
  • 3.3 学科簇类组成分析与热点识别
  • 3.3.1 学科簇类整体组成
  • 3.3.2 识别稳定学科簇类
  • 3.3.3 学科簇类中热点领域及热点问题识别
  • 3.4 本章小结
  • 4 学科代码交叉分析
  • 4.1 指标定义
  • 4.2 指标统计结果及学科代码整体分析
  • 4.3 管理系统工程学科代码交叉分析
  • 4.3.1 交叉程度
  • 4.3.2 交叉内容
  • 4.4 本章小结
  • 5 学科领域演变分析
  • 5.1 学科簇类整体演变分析
  • 5.2 知识管理领域研究内容演变分析
  • 5.2.1 知识管理学科代码演变分析
  • 5.2.2 知识管理学科簇类演变分析
  • 5.3 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    基于文本挖掘的学科领域相关问题研究
    下载Doc文档

    猜你喜欢