基于XML的移动信息检索模型研究

基于XML的移动信息检索模型研究

论文摘要

近年来,信息检索技术的出现,给人们获取信息带来了极大的方便,而XML在信息管理、电子商务、移动通信、网络教育、电子文档交换等诸多领域也有很广泛的应用。本文设计了一个基于XML的移动信息检索系统,主要包括索引库的建立、关键词加权、检索、相似度计算几个部分。 尽管目前基于XML的信息检索模型研究与应用已经取得了很大进展,但在检索方面仍然存在一些问题,如何能使权重更加反映用户的需求,如何能够使检索的查全率与查准率获得提高,如何能够使XML文档结构和内容信息得到充分的挖掘。 针对上述问题,本文根据实际需求,在深入研究分析XML与向量空间模型的基础上,建立了基于内容和结构的倒排索引库,并将各种加权方法应用到XML信息检索领域中,提出了领域词典加权、结构位置、节点距离加权共同作用进行加权的方法。文中详细描述了基于模型的原型系统的总体设计、实现和相关的算法。 本论文的主要工作如下: 1、提出了原型系统的框架设计,并且介绍了此原型系统的设计思路、技术路线以及各个主要的模块的功能。 2、给出了索引库的建立方法、关键词加权的三种不同方法的结合公式、查询与文档之间的相似度计算、检索以及移动设备接口实现的主要算法。 3、实现了一个基于XML的移动信息检索系统,利用Java平台实现,并应用Servlet和JDBC实现移动客户端数据的传输以及对数据库的访问。 4、通过对召回率—精确率曲线的数据进行分析,分析原型系统对于召回率和精确率的提高。 本研究工作的开展,主要是为了解决现实问题,满足当前应用需求,同时积累系统开发研制的经验。基于XML的移动信息检索模型的研究与开发具有一定的应用价值和学术价值。

论文目录

  • 摘要
  • Abstract
  • 1 引言
  • 1.1 问题的提出
  • 1.2 信息检索基本概念
  • 1.2.1 信息检索的目的
  • 1.2.2 信息检索的类型
  • 1.2.3 信息检索的原理
  • 1.2.4 几种信息检索模型及比较
  • 1.3 基于XML文档的信息检索技术
  • 1.3.1 数据检索与信息检索
  • 1.3.2 XML的特点
  • 1.3.3 XML文本文档信息检索现状
  • 1.3.4 移动信息技术的特点
  • 1.4 研究问题的提出
  • 1.4.1 存在的问题
  • 1.4.2 本论文的研究目标
  • 1.4.3 论文结构安排
  • 2 基于XML信息检索模型算法研究
  • 2.1 传统的向量空间模型概述
  • 2.2 XML文档向量
  • 2.2.1 XML文档
  • 2.2.2 XML文档检索
  • 2.3 索引库
  • 2.3.1 索引方式
  • 2.3.2 倒排索引技术
  • 2.3.3 倒排索引表
  • 2.4 领域词典的建立
  • 2.4.1 领域词典的建立
  • 2.4.2 领域词典的结构
  • 2.5 关键词加权
  • 2.5.1 由结构位置影响权重
  • 2.5.2 由节点间距离影响权重
  • 2.5.3 由领域词典影响权重
  • 2.6 检索算法
  • 2.7 本章小结
  • 3 原型系统总体设计
  • 3.1 原型系统的设计思路
  • 3.2 原型系统功能设计与路线选择
  • 3.3 原型系统整体架构
  • 3.4 原型系统功能模块
  • 3.4.1 信息的预处理
  • 3.4.2 文档库的录入及索引管理器
  • 3.4.3 领域词典的建立
  • 3.4.4 检索模块
  • 3.4.5 移动设备接口
  • 3.5 移动设备与检索系统的接口
  • 3.5.1 数据在服务器端与客户端的传输
  • 3.5.2 动态调整文本换行
  • 3.5.3 状态机的应用
  • 3.5.4 动态画面设计
  • 3.6 本章小结
  • 4 基于XML的向量空间检索试验系统
  • 4.1 文本信息检索系统评价指标
  • 4.2 实验
  • 4.3 实验结果
  • 4.3.1 基于几种不同模型的实验
  • 4.3.2 实验数据统计
  • 4.4 实验结果分析
  • 4.5 本章小结
  • 5 检索模型参数的确定
  • 5.1 XML文档检索中向量空间模型的应用
  • 5.2 模型参数的实际设定
  • 5.3 本章小结
  • 6 结论与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 大连理工大学学位论文版权使用授权书
  • 相关论文文献

    • [1].2000年以来我国信息检索模型研究综述[J]. 图书情报导刊 2019(04)
    • [2].基于数据前端分析的图书管理信息检索模型[J]. 科技信息 2013(14)
    • [3].几种常见信息检索模型的分析与评价[J]. 情报杂志 2008(03)
    • [4].大数据分析技术的数字图书馆信息检索模型设计[J]. 现代电子技术 2020(17)
    • [5].信息检索模型的比较研究[J]. 电脑知识与技术 2009(08)
    • [6].信息检索模型及其在跨语言信息检索中的应用进展[J]. 现代情报 2009(07)
    • [7].一种基于领域本体的混合信息检索模型[J]. 计算机工程 2008(21)
    • [8].信息检索模型研究概述[J]. 成功(教育) 2012(12)
    • [9].基于语法的信息检索模型研究——信息检索方法的一个新分支[J]. 情报理论与实践 2011(04)
    • [10].基于多相关本体的模糊信息检索模型[J]. 计算机工程 2010(20)
    • [11].近几年来国外信息检索模型研究进展[J]. 图书馆建设 2008(03)
    • [12].传统信息检索模型及其优化策略研究[J]. 情报探索 2013(02)
    • [13].基于本体自构的网格信息检索模型构建[J]. 情报科学 2012(02)
    • [14].一种基于相关反馈的信息检索模型[J]. 计算机科学 2012(07)
    • [15].基于中文科技期刊数据库信息检索模型的研究[J]. 科教文汇(中旬刊) 2012(10)
    • [16].基于本体的面向概念信息检索模型研究[J]. 微计算机信息 2009(06)
    • [17].一种有效的信息检索模型[J]. 计算机应用研究 2008(08)
    • [18].一种基于分布式Agent的信息检索模型[J]. 科技信息(学术研究) 2008(09)
    • [19].基于数据前端分析的煤炭物流管理系统信息检索模型设计[J]. 硅谷 2014(18)
    • [20].一种基于句子的信息检索模型研究[J]. 计算机应用与软件 2010(03)
    • [21].基于向量空间的信息检索模型的改进[J]. 计算机工程与设计 2008(23)
    • [22].基于多语言本体的中英跨语言信息检索模型及实现[J]. 图书情报工作 2017(01)
    • [23].面向数字图书馆的汉英跨语言信息检索模型[J]. 广西教育学院学报 2016(03)
    • [24].信息熵在粗糙集信息检索模型中的应用[J]. 模糊系统与数学 2010(03)
    • [25].基于本体的信息检索模型研究[J]. 航空计算技术 2009(06)
    • [26].一种基于加权网络和句子窗口方案的信息检索模型[J]. 情报学报 2013(08)
    • [27].同步协作信息检索模型及其机制研究[J]. 图书情报工作 2009(21)
    • [28].基于Xapian站内检索的设计与实现[J]. 山东理工大学学报(自然科学版) 2008(06)
    • [29].新型信息检索模型发展研究[J]. 情报探索 2013(05)
    • [30].利用领域本体概念关系的混合信息检索方法[J]. 计算机应用研究 2011(07)

    标签:;  ;  ;  

    基于XML的移动信息检索模型研究
    下载Doc文档

    猜你喜欢