海洋文献元数据的语义标注技术研究

海洋文献元数据的语义标注技术研究

论文摘要

现在海洋科学蓬勃发展,海洋文献元数据的规模也随着日益扩大。海洋学科的交叉和差异性导致海洋文献元数据的异构性;所以海洋文献元数据的共享和互操作问题亟需解决。语义元数据能够描述资源的语义信息,实现资源数据在语义层次上的共享和互操作。语义标注技术能够将元数据转化为语义元数据;故本文研究海洋文献元数据的语义标注技术。本文通过研究分析国外语义标注工具和方法,总结出海洋文献元数据的语义标注技术有两大关键技术:文献元数据的自动分类挑选和自动语义标注。文献元数据的自动分类挑选技术能够自动地从海量文献元数据中挑选出标注需要的海洋文献元数据;自动语义标注技术能够自动地将海洋文献元数据转换为语义元数据。上述两个技术及其实现是本文研究的核心内容。本文将基于机器学习的文本分类理论应用于文献元数据的自动分类挑选技术;使用文献的摘要信息作为分类文本,通过实验对比最大熵、支持向量机和Adaboost三种分类方法的分类效果;实验结果表明:最大熵是最合适的分类方法,其查准率为99.2492%、查全率为94.4286%。本文使用C#语言设计实现了文献元数据的自动分类系统,该系统使用最大熵作为分类方法。本文深入分析XML Schema,发现其结构定义隐含语义信息。本文提出一种本体自动构建算法,该算法通过解析XML Schema,获取结构定义隐含的语义信息,自动构建原始的领域本体。本算法能够有效地减少本体构建的工作量。由于该算法能够产生XML结构和本体之间的语义映射关系,本文又提出了一种元数据自动语义标注方法。该方法使用本文提出的本体自动构建算法产生语义映射关系,根据语义映射关系实现元数据的自动语义标注。本方法能够广泛适用于XML Schema标准定义的元数据,比GRDDL适用范围广。本文使用Java和Jena实现了本体自动构建算法和自动语义标注方法。本文研究的海洋文献元数据的语义标注技术适用于任何领域的知识元数据,具有较强的通用性。

论文目录

  • 摘要
  • Abstract
  • 第一章引言
  • 1.1 课题提出及研究意义
  • 1.1.1 课题提出
  • 1.1.2 课题来源
  • 1.1.3 研究意义
  • 1.2 语义标注描述
  • 1.3 研究现状
  • 1.3.1 国内外研究现状
  • 1.3.2 研究分析
  • 1.4 本文研究的目的和内容
  • 1.4.1 研究目的
  • 1.4.2 研究内容
  • 1.5 本文的章节安排
  • 第二章 元数据和语义元数据
  • 2.1 元数据与XML
  • 2.1.1 元数据
  • 2.1.2 XML
  • 2.2 元数据的互操作和RDF
  • 2.2.1 元数据的互操作性
  • 2.2.2 RDF
  • 2.2.3 RDF 模式
  • 2.2.4 RDF 与XML
  • 2.3 语义信息模型和本体
  • 2.3.1 语义信息模型
  • 2.3.2 本体与语义Web
  • 2.4 语义元数据
  • 2.4.1 语义元数据的定义
  • 2.4.2 元数据与语义元数据
  • 2.5 本章小结
  • 第三章 基于机器学习的文献元数据分类挑选技术
  • 3.1 问题描述
  • 3.1.1 文本分类问题描述
  • 3.1.2 元数据自动分类挑选问题描述
  • 3.2 文本分类系统概述
  • 3.2.1 文档集
  • 3.2.2 文本表示
  • 3.2.3 文本特征选择
  • 3.2.4 分类方法
  • 3.2.5 性能评估模型
  • 3.3 分类算法对比实验
  • 3.3.1 分类算法工具使用
  • 3.3.2 实验数据处理
  • 3.3.3 实验结果分析
  • 3.4 文献元数据自动分类挑选系统
  • 3.4.1 系统模块设计
  • 3.4.2 系统实现
  • 3.5 本章小结
  • 第四章 一种元数据自动语义标注方法
  • 4.1 自动语义标注问题描述
  • 4.2 XML Schema 隐含语义的分析
  • 4.2.1 数据类型元素分析
  • 4.2.2 嵌套关系分析
  • 4.2.3 结论
  • 4.3 自动语义标注方法描述
  • 4.3.1 方法概述
  • 4.3.2 XML Schema 构建本体
  • 4.3.3 映射关系及其存储
  • 4.3.4 XML 元数据自动语义标注
  • 4.4 自动语义标注实现
  • 4.4.1 流程图
  • 4.4.2 关键技术
  • 4.5 自动语义标注方法分析与比较
  • 4.5.1 时间复杂度分析与比较
  • 4.5.2 应用性能分析与比较
  • 4.6 本章小结
  • 第五章 总结与展望
  • 5.1 论文总结
  • 5.2 工作展望
  • 参考文献
  • 致谢
  • 个人简历
  • 发表的学术论文
  • 科研成果
  • 相关论文文献

    • [1].基于本体的电子文件元数据[J]. 中国档案 2020(03)
    • [2].保存元数据的发展趋势研究[J]. 图书馆杂志 2016(06)
    • [3].气象传输交换控制元数据的设计与实现[J]. 计算机技术与发展 2019(07)
    • [4].档案元数据研究现状简析[J]. 中山大学研究生学刊 2018(04)
    • [5].基于预测的输变电工程元数据分级索引算法[J]. 计算机工程与设计 2019(11)
    • [6].资源建设需要推进元数据战略[J]. 数字图书馆论坛 2017(11)
    • [7].浅析元数据概念在档案领域中的发展[J]. 机电兵船档案 2015(01)
    • [8].档案管理视角下的电子文件元数据[J]. 中国档案 2014(04)
    • [9].国内外描述性元数据研究综述[J]. 四川图书馆学报 2013(04)
    • [10].论电子文件中心元数据方案的管理策略[J]. 档案学通讯 2012(06)
    • [11].元数据在知识管理中的应用[J]. 辽宁师范大学学报(社会科学版) 2011(03)
    • [12].数据仓库中多维元数据的组织研究[J]. 信息与电脑(理论版) 2010(12)
    • [13].元数据应用规范研究[J]. 现代图书情报技术 2010(12)
    • [14].OCLC为出版商启动元数据服务[J]. 现代图书情报技术 2009(11)
    • [15].基于多维度的元数据检索算法研究与实现[J]. 电子设计工程 2020(19)
    • [16].基于本体的电子文件元数据:智慧档案馆建设的关键与核心[J]. 山西档案 2019(05)
    • [17].电子发票核心元数据构成与捕获研究[J]. 北京档案 2018(08)
    • [18].也谈“元数据”[J]. 中国统计 2012(06)
    • [19].用户元数据初探[J]. 图书馆杂志 2010(07)
    • [20].元数据在图书馆音像资料管理中的应用[J]. 科技信息 2010(27)
    • [21].数字资源的元数据自动获取系统[J]. 苏州大学学报(自然科学版) 2009(01)
    • [22].长期保存元数据在文物数字化保护项目中的应用[J]. 数字图书馆论坛 2020(06)
    • [23].元数据的多角度诠释[J]. 档案 2019(05)
    • [24].布鲁姆分类学对提高大学生元数据素养的指导意义[J]. 吉林省教育学院学报(下旬) 2014(01)
    • [25].电子档案元数据分开管理研究[J]. 中国档案 2014(09)
    • [26].数字图书馆的元数据方案及互操作研究[J]. 图书馆学刊 2011(02)
    • [27].中美高校元数据课程的现状与启示[J]. 大学图书馆学报 2011(05)
    • [28].浅析元数据在档案领域的应用[J]. 兰台世界 2009(03)
    • [29].数字图书馆中基础管理性元数据框架研究[J]. 图书馆杂志 2008(06)
    • [30].企业信息化元数据管理方法研究[J]. 中国信息化 2018(04)

    标签:;  ;  ;  

    海洋文献元数据的语义标注技术研究
    下载Doc文档

    猜你喜欢