文本信息检索模型研究

文本信息检索模型研究

论文摘要

随着Internet技术的发展,人类已经步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速准确地检索相关信息已经成为当今信息领域的研究热点。到目前为止,国内外研究组织和公司已经提出了多种信息检索模型并研发出了相应的搜索引擎,这些搜索引擎对于要在网络上获取相关知识的用户起到了一定的导航的作用,但是同时也有不少局限性:返回大量的垃圾信息,重要信息丢失等。本文首先从研究文本信息检索模型入手,阐述了传统的信息检索模型的基本原理及其算法思想,然后着重介绍了有关领域本体的知识以及在领域本体参照下三种语义相似度的计算模型:基于距离的语义相似度计算模型、基于内容的语义相似度计算模型以及基于属性的语义相似度计算模型。得知这三种语义相似度的计算模型分别从三个不同的分析角度来量化概念之间的语义相似度:(1)基于距离的语义相似度计算模型简单、直观,但它非常依赖预先建立好的概念层次网络,网络的结构直接影响到语义相似度的计算;(2)基于内容的语义相似度计算模型在理论上更有说服力,因为在计算概念之间语义相似度的时候,充分利用了信息理论和概率统计理论的相关知识,但是这种方法不能更细致的区分层次网络中各个概念之间语义相似度的值;(3)基于属性的语义相似度计算模型可以很好的模拟人们平时对现实世界中事物之间的认识和辨别,但是要求对客观事物的每一个属性进行详细和全面的描述。因此,针对这三种计算模型的优缺点和领域本体所特有的性质,提出了一种改进的基于领域本体的语义相似度计算模型,该模型能够比较准确地反映概念之间的语义关系,为概念之间的语义关系提供一种有效的量化。论文在上述基础上,通过对基于统计的信息检索模型和基于本体的信息检索模型进行分析比较,得知这两种模型在某种程度上互补:(1)基于统计的信息检索模型强调关键字的统计信息,然而忽略了关键字之间的语义信息;(2)基于本体的信息检索模型强调关键字之间的语义信息,然而忽略了关键字的统计信息。结合两种信息检索模型各自的优点提出了一种混合的信息检索模型。通过该模型构建了一种新的信息检索系统的原型,并对该原型系统的几个重要的模块的功能及原理进行了说明。最后,实验主要采用JSP作开发技术构建了基于C/S模式的文本信息检索系统,通过protégée开发《数据结构》这门课程前三章的领域本体,使用Apache Tomcat 5.0作为Web服务器,采用Microsoft Office XP Access Professional作为数据库构建的实验环境。实验结果证明该原型用于信息检索中,其查全率和查准率方面较基于统计的信息检索模型和基于本体的信息检索模型有了一定的改进。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 论文研究背景
  • 1.2 国内外相关领域的研究现状和存在的问题
  • 1.3 论文研究的内容及其所做的工作
  • 1.4 论文的意义和创新
  • 1.5 论文的结构
  • 第二章 传统的信息检索模型
  • 2.1 基于统计的信息检索模型
  • 2.2 基于超链接的信息检索模型
  • 2.3 改进的向量空间模型
  • 2.4 基于语义本体的信息检索模型
  • 第三章 基于本体的概念语义相似度计算的改进模型
  • 3.1 ontology
  • 3.2 传统的概念语义相似度计算模型
  • 3.3 语义相似度计算的关键因子及改进
  • 3.4 改进的语义相似度计算模型
  • 第四章 基于HIRM的信息检索系统的体系结构
  • 4.1 混合模型的总体设计思想
  • 4.2 混合的信息检索模型
  • 第五章 网页特征词的提取及分词模块
  • 5.1 "Ontology—Webpage"双层模型的形式化描述
  • 5.2 分词的策略
  • 5.3 歧义的分类和识别
  • 第六章 语义扩展模块
  • 6.1 全局分析
  • 6.2 局部分析
  • 6.3 基于用户日志的查询扩展
  • 第七章 实验
  • 7.1 基于领域本体的概念相似度的计算实验
  • 7.2 混合的文本信息检索模型的实验
  • 第八章 总结与展望
  • 参考文献
  • 致谢
  • 硕士期间发表的论文和科研活动
  • 相关论文文献

    • [1].2000年以来我国信息检索模型研究综述[J]. 图书情报导刊 2019(04)
    • [2].基于数据前端分析的图书管理信息检索模型[J]. 科技信息 2013(14)
    • [3].几种常见信息检索模型的分析与评价[J]. 情报杂志 2008(03)
    • [4].大数据分析技术的数字图书馆信息检索模型设计[J]. 现代电子技术 2020(17)
    • [5].信息检索模型的比较研究[J]. 电脑知识与技术 2009(08)
    • [6].信息检索模型及其在跨语言信息检索中的应用进展[J]. 现代情报 2009(07)
    • [7].一种基于领域本体的混合信息检索模型[J]. 计算机工程 2008(21)
    • [8].信息检索模型研究概述[J]. 成功(教育) 2012(12)
    • [9].基于语法的信息检索模型研究——信息检索方法的一个新分支[J]. 情报理论与实践 2011(04)
    • [10].基于多相关本体的模糊信息检索模型[J]. 计算机工程 2010(20)
    • [11].近几年来国外信息检索模型研究进展[J]. 图书馆建设 2008(03)
    • [12].传统信息检索模型及其优化策略研究[J]. 情报探索 2013(02)
    • [13].基于本体自构的网格信息检索模型构建[J]. 情报科学 2012(02)
    • [14].一种基于相关反馈的信息检索模型[J]. 计算机科学 2012(07)
    • [15].基于中文科技期刊数据库信息检索模型的研究[J]. 科教文汇(中旬刊) 2012(10)
    • [16].基于本体的面向概念信息检索模型研究[J]. 微计算机信息 2009(06)
    • [17].一种有效的信息检索模型[J]. 计算机应用研究 2008(08)
    • [18].一种基于分布式Agent的信息检索模型[J]. 科技信息(学术研究) 2008(09)
    • [19].基于数据前端分析的煤炭物流管理系统信息检索模型设计[J]. 硅谷 2014(18)
    • [20].一种基于句子的信息检索模型研究[J]. 计算机应用与软件 2010(03)
    • [21].基于向量空间的信息检索模型的改进[J]. 计算机工程与设计 2008(23)
    • [22].基于多语言本体的中英跨语言信息检索模型及实现[J]. 图书情报工作 2017(01)
    • [23].面向数字图书馆的汉英跨语言信息检索模型[J]. 广西教育学院学报 2016(03)
    • [24].信息熵在粗糙集信息检索模型中的应用[J]. 模糊系统与数学 2010(03)
    • [25].基于本体的信息检索模型研究[J]. 航空计算技术 2009(06)
    • [26].一种基于加权网络和句子窗口方案的信息检索模型[J]. 情报学报 2013(08)
    • [27].同步协作信息检索模型及其机制研究[J]. 图书情报工作 2009(21)
    • [28].基于Xapian站内检索的设计与实现[J]. 山东理工大学学报(自然科学版) 2008(06)
    • [29].新型信息检索模型发展研究[J]. 情报探索 2013(05)
    • [30].利用领域本体概念关系的混合信息检索方法[J]. 计算机应用研究 2011(07)

    标签:;  ;  ;  ;  

    文本信息检索模型研究
    下载Doc文档

    猜你喜欢