基于LUCENE的军用文书检索系统的研究与设计

基于LUCENE的军用文书检索系统的研究与设计

论文摘要

军用文书包括平时文书和作战文书,是军队各级领导机关行使职能,实施指挥和管理部队的重要工具和基本手段。作为军队机关公文,在指挥员和指挥机关联贯、控制指挥对象,指挥本级训练、劳动、操课及作战行动等活动中起着衔接作用,而文书本身也直接影响到将机关的信息发布、管理、服务、与下级沟通、向上级请示汇报、平级之间协调的功能。随着计算机和信息技术的迅速发展,军用文书信息量正以指数规律迅猛增长,军队办公网已经成为军用文书最重要的海量信源,如何找到相应的军用文书己经成为人们获取信息资源日益严重的问题。研究了基于Lucene的军用文书检索系统,首先介绍了全文检索引擎,阐述了其产生和发展、系统结构,对搜索引擎的搜索、索引和检索及其技术进行了深入研究,对全文检索系统的构建和使用进行了深入分析。然后对Apahce全文检索系统Lucene源码的剖析和实践,重点研究了Lucene的系统组织结构、系统特点、数据流以及索引数据库的文件结构。对Lucene的重要包进行了分析,深刻理解其搜索过程以及搜索方式。提出了基于Lucene的军用文书检索系统的关键技术,对文档的分析技术进行了剖析,研究了中文分词技术,提出了系统的索引过程,重点研究了索引数据结构和索引的组织方式,研究了系统的检索技术,对典型的检索技术进行了分析。通过对军用文书搜索引擎主要技术的研究,设计并实现了一个军用文书信息搜索引擎系统。分析了系统的需求,提出了系统框架和结构。对各子系统如信息搜索子系统、索引子系统、搜索子系统和页面去重子系统进行了详细设计和实现,并给出了一部分实现代码。基于Lucene的军用文书检索系统具有良好的扩展性,不仅适用于通用搜索引擎系统,而且适用于目前广泛使用的专业文献检索系统。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景与意义
  • 1.2 国内外现状
  • 1.2.1 国内现状
  • 1.2.2 国外现状
  • 1.3 本文的研究内容
  • 1.4 本文的结构
  • 第二章 搜索引擎技术及Lucene技术剖析
  • 2.1 系统结构
  • 2.2 Lucene的优势和特点
  • 2.3 Lucene的系统结构
  • 2.4 Lucene的其他技术分析
  • 2.4.1 数据流
  • 2.4.2 并发控制及锁机制
  • 2.5 本章小结
  • 第三章 系统关键技术
  • 3.1 中文分词技术
  • 3.1.1 一元分词和二元分词
  • 3.1.2 机械分词
  • 3.1.3 基于理解的分词
  • 3.1.4 基于统计的分词
  • 3.1.5 分词技术的比较
  • 3.2 索引技术
  • 3.2.1 索引数据结构
  • 3.2.2 索引组织
  • 3.2.3 工作过程
  • 3.3 检索技术
  • 3.3.1 布尔逻辑方法
  • 3.3.2 模糊逻辑方法
  • 3.3.3 向量空间方法
  • 3.3.4 概率检索模型
  • 3.4 本章小结
  • 第四章 系统设计和实现
  • 4.1 需求分析
  • 4.1.1 可行性分析
  • 4.1.2 功能分析
  • 4.1.3 用例分析
  • 4.2 系统结构
  • 4.3 系统实现
  • 4.3.1 信息过滤技术
  • 4.3.2 页面更新策略
  • 4.3.3 索引子系统的实现
  • 4.3.4 搜索子系统的实现
  • 4.3.5 页面去重子系统的实现
  • 4.4 实验及分析
  • 4.4.1 测试环境
  • 4.4.2 测试数据
  • 4.4.3 测试方法
  • 4.4.4 测试结果
  • 4.5 本章小结
  • 总结与展望
  • 参考文献
  • 攻读硕士学位期间取得的学术成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于LUCENE的军用文书检索系统的研究与设计
    下载Doc文档

    猜你喜欢