基于同义词扩展的贝叶斯网络结构化文档检索模型

基于同义词扩展的贝叶斯网络结构化文档检索模型

论文摘要

结构化文档检索系统利用文档的结构信息,对文档的部分内容建立索引并检索呈现,所得查询结果能精细化地表达查询需求。利用同义词扩展查询是实现基于语义检索的一种有效方式。术语相似度能量化描述同义词间的相似程度。在信息检索系统中,利用量化的同义词关系扩展查询可以在不降低查准率的条件下提高查全率。本文利用基于《知网》的术语相似度计算方法量化同义词间的相似关系,并将这种关系引入到基于贝叶斯网络的结构化文档信息检索模型中,用于实现基于语义概念的检索,构造基于这种量化术语关系的扩展贝叶斯网络检索模型。详细描述了如何有效的挖掘术语同义词关系并采用有效的量化算法对其进行量化;给出了基于此量化同义词关系扩展的贝叶斯网络结构化文档检索模型的拓扑结构,网络中各层结点的概率计算方法和模型推理与文档检索的详细过程。最后对扩展模型进行了评测,结果表明扩展模型能有效地提高检索性能,各个粒度不同的结构元素的排序也更能表达查询需求。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.2.1 关于结构化文档检索
  • 1.2.2 基于贝叶斯网络的信息检索的研究
  • 1.2.3 关于同义词的研究
  • 1.3 本文工作
  • 1.4 论文组织
  • 第2章 信息检索技术研究与发展
  • 2.1 传统信息检索概述
  • 2.1.1 信息检索定义及工作原理
  • 2.1.2 索引术语与文档表示
  • 2.1.3 经典信息检索模型简介
  • 2.2 信息检索中的贝叶斯网络
  • 2.2.1 贝叶斯网络
  • 2.2.2 基于贝叶斯网络的信息检索模型
  • 2.3 信息检索性能评测
  • 2.4 结构化信息检索
  • 2.4.1 结构化文档检索概述
  • 2.4.2 文档结构表示模型
  • 2.5 本章小结
  • 第3章 同义词识别技术研究与发展
  • 3.1 面向信息检索的同义词定义
  • 3.2 国外同义词识别方法
  • 3.3 国内同义词识别方法
  • 3.3.1 基于字面相似度和词素相似度的识别算法
  • 3.3.2 基于语义体系的同义词识别算法
  • 3.4 本章小结
  • 第4章 基于同义词扩展的贝叶斯网络结构化文档检索模型
  • 4.1 基于贝叶斯网络的结构化文档检索
  • 4.1.1 BNR-SD模型拓扑结构
  • 4.1.2 网络结点的概率估计
  • 4.2 挖掘术语同义词关系及其量化
  • 4.2.1 挖掘同义词及其关系量化
  • 4.2.2 权重计算
  • 4.3 基于同义词扩展的结构化检索模型的贝叶斯网络拓扑
  • 4.4 结点概率估计
  • 4.5 推理与检索
  • 4.6 本章小结
  • 第5章 模型评测与结果分析
  • 5.1 实验准备工作
  • 5.1.1 测试集构建及其规范化
  • 5.1.2 构建查询实例
  • 5.2 信息检索
  • 5.3 实验结果分析
  • 5.4 本章小结
  • 第6章 总结与展望
  • 参考文献
  • 攻读硕士学位期间发表论文情况
  • 致谢
  • 相关论文文献

    • [1].云计算环境中结构化文档形式化建模[J]. 计算机应用 2013(05)
    • [2].非结构化文档的标记方法研究[J]. 中国管理信息化 2012(04)
    • [3].基于XML技术的结构化文档编辑器研究[J]. 软件 2014(05)
    • [4].基于CSS的结构化文档视觉信息伪装技术实现[J]. 软件导刊 2013(01)
    • [5].内容库在政府信息公开系统中的应用研究[J]. 计算机应用与软件 2019(11)
    • [6].基于Lucene的非结构化文档全文检索系统研究与实现[J]. 软件导刊 2013(10)
    • [7].如何使用Visual Basic读取XML文件[J]. 黑龙江气象 2011(03)
    • [8].基于Hadoop的XML查询[J]. 信息通信 2016(12)
    • [9].基于结构化文档的钓鱼网站检测算法[J]. 计算机工程与设计 2019(10)
    • [10].文档数据库相关关键技术研究[J]. 电子技术与软件工程 2015(19)
    • [11].基于JATS标准的医学期刊电子资源格式处理与转化[J]. 中国科技期刊研究 2018(08)
    • [12].统一的商业绩效管理[J]. 软件世界 2009(04)
    • [13].XML语言在Web开发中的应用研究[J]. 软件导刊 2013(12)
    • [14].面向多级安全的结构化文档描述模型[J]. 通信学报 2012(S1)
    • [15].搜索处理技术在医院非结构化文档(电子病历)的应用[J]. 中国数字医学 2013(06)
    • [16].用BIM“智”造特大型桥梁[J]. 中国公路 2018(11)
    • [17].利用JavaScript编程在Indesign中实现基于XML结构化文档的自动排版[J]. 中国科技期刊研究 2015(02)
    • [18].基于XML的电子试卷的结构模型设计[J]. 现代交际 2015(10)
    • [19].基于行为的结构化文档多级访问控制[J]. 计算机研究与发展 2013(07)
    • [20].XML信息检索技术综述[J]. 甘肃科技 2011(19)
    • [21].荣联云盘系统打造时尚办公新平台[J]. 软件和信息服务 2015(02)
    • [22].分布式环境下的文档相似度研究与实现[J]. 现代图书情报技术 2011(Z1)
    • [23].基于Lucene的PDF文档文本解析的实现[J]. 信息与电脑(理论版) 2009(16)
    • [24].非结构化文档全文检索技术研究及在协同办公系统中的应用[J]. 电子技术与软件工程 2018(09)
    • [25].一种面向领域文档的结构化检索模型及其在农技处方检索中的应用[J]. 计算机科学 2015(10)
    • [26].简单介绍可扩展标记语言XML[J]. 电脑知识与技术 2010(20)
    • [27].手势与手写文档中文本行的提取[J]. 计算机应用与软件 2008(06)
    • [28].自然语言处理技术在建筑工程中的应用研究综述[J]. 图学学报 2020(04)

    标签:;  ;  ;  ;  ;  

    基于同义词扩展的贝叶斯网络结构化文档检索模型
    下载Doc文档

    猜你喜欢