WordNet和《中国分类主题词表》的映射研究

WordNet和《中国分类主题词表》的映射研究

论文摘要

随着网络的发展,信息数量激增但缺乏结构性,使得用户查找所需知识、系统呈现相关信息以及专家维护信息系统的难度都大大增加。基于此,通过建立本体并高效地实现本体的共享从而实现对信息、知识的共享和重用为越来越多的学者所关注并成为相关领域学者研究的热点。现实中,不同领域甚至同一领域中往往存在多个异构本体,能够运用于所有本体并真正实现本体共享的方法与系统并不多见。本体映射通过建立异构本体间的语义关系并输出概念、属性等映射对来实现本体间的重用和互操作。中文资源是全球知识与信息网络的重要组成部分,实现中文本体间以及中、外文表示的本体间的映射是实现本体共享、重用的一个重要方面。目前针对本体映射的研究有很多,但在众多的映射方法和系统中,对中文本体间以及对中、外文本体间进行映射处理的仍非常有限,而且有些映射系统在运行时并不考虑跨语言本体之间产生的语义上的歧义。本文致力于WordNet和《中国分类主题词表》的映射研究,旨在扩大《中国分类主题词表》的词汇量,从而为实现中文本体间的映射提供一个映射的标准与基础,使得中文本体间的映射更加准确并且更能体现中文的结构和特点。本文采用了中文WordNet和Web版的《中国分类主题词表》,其中《中国分类主题词表》并不是一个标准的本体,但其具有类似于本体的特征,比如包含大量的词汇、具有语义特征。文章首先通过Protege用本体语言OWL对《中国分类主题词表》进行描述输出,转换为本体的标准形式,其次对二者进行本体预处理并通过虚拟文档的建立提取出候选映射对,然后利用HowNet(知网)来实现二者概念、属性以及实例等在元素和结构层面上的语词相似度计算,并选取出最终的映射对。文章最后通过实验分析证明了本文提出的映射方法的有效性。

论文目录

  • 中文摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究的背景和意义
  • 1.2 本体映射研究状况述评
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 论文研究内容与章节安排
  • 1.4 论文创新之处
  • 第二章 本体映射及其算法与系统
  • 2.1 本体以及本体异构
  • 2.1.1 本体的定义和本体异构的产生
  • 2.1.2 本体异构的种类
  • 2.1.3 解决本体异构的方法
  • 2.2 本体映射
  • 2.2.1 本体映射及其过程
  • 2.2.2 相似度与本体映射函数
  • 2.3 目前常用的本体映射方法与系统
  • 2.3.1 本体映射方法的理论研究
  • 2.3.2 本体映射原型方法及系统
  • 第三章 WordNet和《中国分类主题词表》的映射模型构建
  • 3.1 WordNet、《中国分类主题词表》与HowNet
  • 3.1.1 WordNet
  • 3.1.2 《中国分类主题词表》
  • 3.1.3 HowNet
  • 3.1.4 选用三种本体词典进行映射的意义
  • 3.2 映射模型框架设计
  • 3.2.1 映射模型设计目标
  • 3.2.2 映射模型模块设计
  • 3.3 《中国分类主题词表》的本体形式转化
  • 3.3.1 词表与本体的比较与融合
  • 3.3.2 《中国分类主题词表》的本体转化
  • 3.4 基于树结构的本体预处理
  • 3.5 基于虚拟文档的映射对选取
  • 3.5.1 虚拟文档的建立和相似度计算
  • 3.5.2 映射的发现
  • 3.6 基于知网的多策略词汇语义相似度计算
  • 3.6.1 相似度测量规则
  • 3.6.2 基于知网的词汇相似度计算方式
  • 3.6.3 已收录词汇相似度计算策略
  • 3.6.4 未收录词汇的相似度计算策略
  • 3.7 映射对的选取
  • 第四章 实验及结果分析
  • 4.1 实验
  • 4.1.1 评估标准
  • 4.1.2 实验数据
  • 4.2 实验分析与改进
  • 第五章 结论与未来工作
  • 参考文献
  • 攻读硕士学位期间取得研究成果
  • 致谢
  • 个人简况及联系方式
  • 相关论文文献

    • [1].WordNet在大学英语词汇教学中的应用初探[J]. 品位经典 2019(10)
    • [2].基于WordNet的语义相似度算法研究[J]. 内蒙古师范大学学报(哲学社会科学版) 2016(04)
    • [3].一种基于WordNet的混合式语义相似度计算方法[J]. 计算机工程与科学 2017(05)
    • [4].一种基于WordNet语义相似度的改进算法[J]. 数字技术与应用 2013(08)
    • [5].WordNet在图像语义分析中的应用[J]. 科技创新导报 2012(14)
    • [6].基于WordNet词义消歧的系统融合[J]. 自动化学报 2010(11)
    • [7].基于WordNet的无导词义消歧方法[J]. 浙江大学学报(工学版) 2010(04)
    • [8].WordNet在文本聚类中的应用研究[J]. 现代图书情报技术 2009(10)
    • [9].基于WordNet词义消歧的语义检索研究[J]. 湘潭大学自然科学学报 2017(02)
    • [10].WordNet应用问题研究[J]. 科技致富向导 2013(35)
    • [11].浅议WordNet的发展趋势与应用[J]. 科技致富向导 2010(26)
    • [12].由Wordnet话词汇空缺[J]. 中国科技信息 2011(21)
    • [13].一种集成WordNet到受控自然语言系统的算法[J]. 华中科技大学学报(自然科学版) 2010(04)
    • [14].概念图及WordNet辅助大学英语词汇教学的可能性探究[J]. 教育与教学研究 2009(03)
    • [15].基于WordNet的本体查询方法研究[J]. 郑州大学学报(工学版) 2016(03)
    • [16].一种基于WordNet的跨语言地理本体匹配方法[J]. 地理信息世界 2016(02)
    • [17].WordNet在查询扩展中的应用研究[J]. 科技信息 2009(14)
    • [18].基于WordNet的隐喻自动处理研究[J]. 外语电化教学 2010(06)
    • [19].概念图及WordNet辅助大学英语词汇教学实证研究[J]. 电化教育研究 2009(08)
    • [20].基于WordNet的概念语义相似度研究[J]. 湖南科技学院学报 2008(12)
    • [21].基于WordNet语义知识库的英语学习者作文局部连贯自动评价[J]. 河南师范大学学报(自然科学版) 2016(06)
    • [22].基于WordNet的语义相似度算法改进研究[J]. 软件导刊 2016(05)
    • [23].基于边权重的WordNet词语相似度计算[J]. 计算机工程与应用 2018(01)
    • [24].基于wordNet的类别可拓展网页分类系统(英文)[J]. 深圳大学学报(理工版) 2009(02)
    • [25].WordNet应用问题研究[J]. 科技致富向导 2013(23)
    • [26].一种基于WordNet和Corpus Statistics的语义相似性计算方法[J]. 吉林大学学报(理学版) 2010(05)
    • [27].基于中文WordNet的中英文词语相似度计算[J]. 郑州大学学报(理学版) 2010(02)
    • [28].基于WordNet的通用服务分类方法[J]. 计算机工程与科学 2013(09)
    • [29].基于WordNet和聚焦爬虫的半自动领域本体构建[J]. 计算机应用 2008(S2)
    • [30].基于WordNet的关联数据本体映射研究[J]. 情报杂志 2013(02)

    标签:;  ;  ;  ;  ;  

    WordNet和《中国分类主题词表》的映射研究
    下载Doc文档

    猜你喜欢