基于WEB的林产品信息资源整合方法研究

基于WEB的林产品信息资源整合方法研究

论文摘要

基于高速互联网(INTERNET)链接的分布式WWW服务在很短时间内便产生了大量的信息。随着时间推移,在WEB页面中存储的信息在互联网的各个站点中不断地进行着运动,使得相关领域的信息具有了海量且离散的特点。以WEB为存储介质的信息所具有的这些特征给用户搜索信息带来了不便;同时,大量不完整的信息充斥在各个网站中,使相关领域的从业人员无法判断信息的真实性和有效性。为了解决这些问题,本研究提出了WEB信息整合的概念。在此基础上,通过相关技术地引入和创新,对行业领域内以WEB为存储载体的信息从发现、组织和定位三个方面进行了整合方法的探讨,并建立了WEB信息整合的模型。在实践阶段,使用该模型及其中包含的方法对互联网网站中的林产品信息资源进行了整合。林产品信息资源WEB信息整合的具体实践方法包括以下三个方面。(1)信息源的发现。通过对与林产品相关领域内不同类型网站WEB页面的特征分析后,提出了一种基于关键资源的网站识别算法(TD-SVM),用于判断网站的类别。并通过网络爬虫程序和TD-SVM算法对互联网中提供林产品信息资源的网站进行了识别与发现,为林产品WEB信息整合提供了信息源的基础。(2)信息的组织。在对林产品信息资源的信息组织的过程中,构建了林产品信息资源的知识分类体系。以该分类体系为基础,通过改进特征抽取算法的朴素贝叶斯分类器对抽取的林产品信息资源进行了多层次分类,从而完成了对海量林产品文本信息地有序化组织,为林产品信息资源的整合提供了数据基础。(3)信息的定位。信息定位的过程中从包括基于语义扩展的信息检索和对林产品信息资源知识库中的知识发现两方面进行讨论。具体实现过程为,通过引入本体对林产品信息资源进行知识建模;用改进的本体概念节点相似度算法对检索词进行语义扩展;使用手工标引的方法将林产品流通领域的规则扩展到知识模型,然后使用描述逻辑从林产品知识模型中推理出隐含的知识,最终实现知识层面的信息整合。本研究提出WEB信息整合模型以及涉及到的方法对林产品信息资源从信息发现、信息组织和知识发现三个层次上进行了探讨和实践。该模型与方法对其它领域的WEB信息整合的实践活动具有一定的参考价值和指导意义。

论文目录

  • 中文摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景与依据
  • 1.1.1 研究背景
  • 1.1.2 存在的问题
  • 1.1.3 研究的意义
  • 1.2 国内外研究现状
  • 1.2.1 信息整合的理论研究
  • 1.2.2 信息整合机制研究
  • 1.2.3 信息整合的系统及技术研究
  • 1.2.4 WEB信息整合的发展趋势
  • 1.3 研究的方法和技术路线
  • 1.4 论文的思路及组织结构
  • 2 WEB信息整合的理论基础
  • 2.1 信息资源管理理论
  • 2.1.1 信息资源的含义
  • 2.1.2 信息资源管理过程
  • 2.2 本体论
  • 2.2.1 本体的含义
  • 2.2.2 本体的建模原语
  • 2.2.3 本体间的语义关系
  • 2.2.4 构造本体的规则
  • 2.2.5 本体在WEB信息整合中解决的问题
  • 2.3 知识管理理论
  • 2.3.1 知识管理理论的含义
  • 2.3.2 知识管理的顺序
  • 2.4 小结
  • 3 WEB信息整合模型和技术体系
  • 3.1 引言
  • 3.2 WEB信息整合(WEB INFORMATION INTEGRATION)的概念辨析
  • 3.3 WEB信息整合模型目标与原则
  • 3.3.1 WEB信息整合模型的目标
  • 3.3.2 WEB信息整合模型的原则
  • 3.4 WEB信息整合逻辑关系模型
  • 3.5 WEB信息整合中的关键技术及实施基础
  • 3.5.1 林业领域语料库和专业词库的构建
  • 3.5.2 文本分类(Text Categorization)
  • 3.5.3 信息检索
  • 3.5.4 描述逻辑
  • 3.6 林产品信息资源本体的构建
  • 3.6.1 林产品本体概念的分类方法
  • 3.6.2 基于本体的林产品信息资源知识建模
  • 3.6.3 林产品信息资源本体核心概念集的建立
  • 3.6.4 林产品信息资源本体的构建过程
  • 3.6.5 林产品信息资源本体的形式化表示与可视关联图
  • 3.7 小结
  • 4 基于关键资源主题信息源的识别与发现
  • 4.1 引言
  • 4.2 相关工作
  • 4.3 主题网站WEB页面特征分析
  • 4.3.1 基于网页语义块的主题特征分析
  • 4.3.2 基于超链接的网络节点特征分析
  • 4.4 基于页面内容的网站关键资源特征建模
  • 4.4.1 主题网站特征词的选择
  • 4.4.2 改进的TF-IDF加权公式
  • 4.5 网站关键资源的选取算法
  • 4.5.1 关键资源(Key Resource)的作用
  • 4.5.2 基于方差的特征资源选取算法
  • 4.5.3 实验结果及分析
  • 4.6 基于关键资源的主题网站识别算法(TD-SVM)
  • 4.6.1 支持向量机
  • 4.6.2 网站分类过程
  • 4.6.3 网站分类实验
  • 4.7 主题网站节点搜索
  • 4.8 小结
  • 5 林产品文本信息资源的组织
  • 5.1 引言
  • 5.2 林产品信息资源的组织存在的问题
  • 5.2.1 对非平衡数据分类的问题
  • 5.2.2 林产品信息资源多层次分类的问题
  • 5.3 非平衡数据分类问题的解决方法
  • 5.3.1 改进的非平衡数据分类方法
  • 5.3.2 改进的特征抽取算法
  • 5.4 基于改进特征选取算法的朴素贝叶斯分类器
  • 5.4.1 基于朴素贝叶斯算法的分类器
  • 5.4.2 朴素贝叶斯分类器的构造
  • 5.4.3 对非平衡数据的分类实验
  • 5.4.4 实验结果及评价
  • 5.5 林产品信息的多层次分类体系
  • 5.5.1 林产品信息资源的组织体系
  • 5.5.2 多层次文本分类算法
  • 5.5.3 实验结果及评价
  • 5.6 小结
  • 6 基于本体的林产品信息定位
  • 6.1 引言
  • 6.2 基于本体的信息检索模型
  • 6.2.1 语义检索
  • 6.2.2 基于本体的语义检索
  • 6.3 本体概念语义相似度计算
  • 6.3.1 语义相似度算法
  • 6.3.2 基于本体的语义相似度计算
  • 6.3.3 基于本体概念语的义相似度计算改进
  • 6.3.4 差异参数对概念集合相似度的影响分析
  • 6.4 基于林产品本体的信息检索系统
  • 6.4.1 文本文档检索实现的方法
  • 6.4.2 性能和评价标准
  • 6.4.3 实验结果及评价
  • 6.4.4 实证分析
  • 6.5 基于语义推理的知识模型
  • 6.5.1 林产品信息知识的产生
  • 6.5.2 林产品信息知识的获取
  • 6.5.3 林产品信息知识的组织
  • 6.5.4 林产品的知识共享
  • 6.5.5 实例分析
  • 6.6 小结
  • 7 讨论与未来展望
  • 7.1 讨论
  • 7.2 主要创新点
  • 7.3 展望
  • 参考文献
  • 附录
  • 个人简介
  • 导师简介
  • 在读期间发表论文情况
  • 致谢
  • 相关论文文献

    • [1].关于大数据环境下高校档案信息资源整合的思考[J]. 产业创新研究 2019(12)
    • [2].新媒体背景下图书情报的信息资源整合策略[J]. 办公室业务 2019(23)
    • [3].网络环境下档案信息资源整合研究[J]. 档案时空 2019(10)
    • [4].档案信息资源整合与利用探讨[J]. 兰台内外 2020(27)
    • [5].2014—2018年我国档案信息资源整合研究综述[J]. 兰台内外 2018(13)
    • [6].2014-2018年我国档案信息资源整合研究综述[J]. 办公自动化 2018(22)
    • [7].基于互联网环境下档案信息资源整合的思考[J]. 机电兵船档案 2019(03)
    • [8].信息资源整合下如何提升图书馆信息咨询服务质量[J]. 数字通信世界 2019(06)
    • [9].档案信息资源整合对策分析[J]. 兰台世界 2019(S1)
    • [10].农业部全力扎实推进政务信息资源整合共享[J]. 中国农业信息 2017(21)
    • [11].青岛市:坚持政务信息资源整合共享[J]. 中国信息界 2017(06)
    • [12].浅谈网络环境下的档案信息资源整合[J]. 黑龙江档案 2018(01)
    • [13].基于云计算的高校档案信息资源整合[J]. 城建档案 2016(12)
    • [14].大数据时代高校图书馆信息资源整合系统平台的构建研究[J]. 四川图书馆学报 2016(06)
    • [15].数字图书馆网络信息资源整合研究[J]. 通讯世界 2017(03)
    • [16].图书馆信息资源整合的模式分析[J]. 图书馆学刊 2016(12)
    • [17].数字图书馆信息资源整合探究[J]. 电脑编程技巧与维护 2017(05)
    • [18].浅谈网络环境下档案信息资源整合[J]. 黑龙江科技信息 2017(08)
    • [19].浅谈网络环境下档案信息资源整合[J]. 黑龙江科技信息 2017(12)
    • [20].高校图书与档案信息资源整合的策略与价值[J]. 档案管理 2017(03)
    • [21].博物馆信息资源整合的思考[J]. 数字与缩微影像 2016(01)
    • [22].云计算技术在体育信息资源整合中的应用[J]. 自动化与仪器仪表 2016(05)
    • [23].信息资源整合方法与案例分析[J]. 云南民族大学学报(自然科学版) 2016(05)
    • [24].医院档案信息资源整合探析[J]. 档案天地 2014(S1)
    • [25].基于云计算的高校档案信息资源整合研究[J]. 兰台世界 2014(35)
    • [26].基于知识流动走向角度的科技信息资源整合问题研究[J]. 广东科技 2015(06)
    • [27].Web2.0式的档案信息资源整合原则与模式探析[J]. 档案学研究 2015(01)
    • [28].公共危机治理中的信息资源整合机制[J]. 齐齐哈尔大学学报(哲学社会科学版) 2015(07)
    • [29].档案信息资源整合与共享的风险分析[J]. 兰台世界 2015(20)
    • [30].实现城建档案信息资源整合性服务的研究[J]. 城建档案 2015(08)

    标签:;  ;  ;  ;  ;  ;  

    基于WEB的林产品信息资源整合方法研究
    下载Doc文档

    猜你喜欢