基于Lucene的电子档案检索系统的设计与实现

基于Lucene的电子档案检索系统的设计与实现

论文摘要

随着信息技术的不断发展,“信息过载”已经成为日益严重的问题。维护成本高、索引数据源单一、缺乏灵活性等现有的搜索引擎问题已经成为信息搜索技术发展的瓶颈。本文首先介绍了信息检索系统的分类、发展趋势,并详细研究了搜索引擎的工作原理、性能指标和基于Lucene的索引和搜索技术,接着对电子档案检索系统的功能性需求和非功能性需求进行了深入的研究和分析,最后,本文根据UNIS电子档案检索系统的需求,基于全文检索工具软件包Lucene,设计并实现了一个高性能的基于Lucene的站内档案检索系统。该系统分为异构文档解析、数据处理、文档索引、文档搜索、用户检索服务等五个模块,这些模块不但能实现了本身应有的功能,而且能完成相互间的交互。本文还对该系统进行了测试和分析。测试数据和分析结果表明,文中设计和实现的基于Lucene的信息检索系统的查全率、查准率等性能指标完全满足了设计要求,该系统方案是高效可行的。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 项目背景与研究意义
  • 1.2 国内外现状及发展趋势
  • 1.3 本文研究内容
  • 1.4 本文组织结构
  • 第二章 相关技术概述
  • 2.1 搜索引擎的概述
  • 2.1.1 搜索引擎的概念及功能
  • 2.1.2 搜索引擎的工作原理
  • 2.1.3 搜索引擎的性能指标
  • 2.2 Lucene的概述
  • 2.2.1 Lucene索引技术
  • 2.2.2 Lucene搜索技术
  • 2.3 MVC框架及JBOSS服务器介绍
  • 第三章 电子档案检索系统的需求分析与概要设计
  • 3.1 电子档案检索的需求分析
  • 3.1.1 系统功能需求分析
  • 3.1.2 系统非功能性需求分析
  • 3.2 索引检索子系统的概要设计
  • 3.2.1 功能模块图
  • 3.2.2 逻辑模型图
  • 3.2.3 体系结构图
  • 3.3 索引检索子系统的用例分析
  • 3.4 本章小结
  • 第四章 电子档案检索系统的详细设计与实现
  • 4.1 总体设计图
  • 4.2 基于MVC架构的实现策略
  • 4.3 各模块的设计与实现
  • 4.3.1 异构文档解析模块
  • 4.3.2 数据处理模块
  • 4.3.3 文档索引模块
  • 4.3.4 文档搜索模块
  • 4.3.5 用户检索模块
  • 4.4 Lucene排序算法的实现
  • 4.5 Lucene中文分词的实现
  • 4.6 本章小结
  • 第五章 运行、测试及性能分析
  • 5.1 运行环境
  • 5.2 系统运行过程
  • 5.3 系统测试
  • 5.3.1 解析器的模拟测试
  • 5.3.2 文档索引生成的模拟测试
  • 5.3.3 索引文件优化的模拟测试
  • 5.3.4 搜索关键词的模拟测试
  • 5.4 系统性能分析
  • 5.5 本章小结
  • 第六章 总结与展望
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].浅谈如何建立和完善档案检索体系[J]. 黑龙江史志 2015(05)
    • [2].档案检索体系的理论分析与发展原则探讨[J]. 考试周刊 2014(A3)
    • [3].基于个性化的档案检索方式研究[J]. 黑龙江史志 2015(05)
    • [4].档案检索学科进一步发展的动因分析[J]. 档案与建设 2011(01)
    • [5].本体在档案检索系统中的应用[J]. 宁波职业技术学院学报 2010(05)
    • [6].基于生态位理论的档案检索学科发展研究[J]. 档案 2010(05)
    • [7].档案检索学科形成与发展刍议[J]. 档案学通讯 2009(06)
    • [8].论档案检索系统的运行机理[J]. 黑龙江史志 2008(17)
    • [9].完善档案检索功能 提升档案利用效率[J]. 兰台世界 2013(S4)
    • [10].网络环境下档案检索学科建设与发展初探[J]. 兰台世界 2013(32)
    • [11].史学研究视野下的档案检索[J]. 军事历史研究 2010(S1)
    • [12].档案检索系统中的规范记录研究[J]. 档案时空 2009(02)
    • [13].档案检索篇——档案信息化实用知识问答(四)[J]. 上海档案 2010(03)
    • [14].城市规划档案检索利用新模式——空间查询模式[J]. 兰台世界 2014(11)
    • [15].网络时代档案检索学科创新问题摭探[J]. 档案学通讯 2010(05)
    • [16].档案检索系统深度开发应用研究[J]. 档案时空 2010(12)
    • [17].语言文字知识在档案检索中的运用[J]. 兰台世界 2008(17)
    • [18].浅谈新时期档案的检索服务发展[J]. 治黄科技信息 2019(02)
    • [19].刍议档案检索[J]. 城建档案 2013(08)
    • [20].信息技术应用于档案检索的思考[J]. 山东档案 2009(04)
    • [21].著录——科技档案检索之我见[J]. 机电兵船档案 2008(02)
    • [22].档案馆网站档案检索系统探究[J]. 四川档案 2010(02)
    • [23].档案检索工具及其体系探讨[J]. 黑龙江史志 2013(23)
    • [24].提高数字档案检索利用完整率和准确率的实践与体会[J]. 山东档案 2011(03)
    • [25].提高数字档案检索利用完整率和准确率的几点体会[J]. 山东档案 2011(05)
    • [26].基于Lucene的站内电子档案检索系统设计与实现[J]. 软件导刊 2012(04)
    • [27].用户行为分析与档案检索系统的设计[J]. 兰台世界 2010(14)
    • [28].合理利用档案的检索咨询[J]. 山西档案 2009(S1)
    • [29].合理利用档案的检索咨询[J]. 山西档案 2009(S2)
    • [30].电子文献档案资源的检索与利用评析[J]. 内江科技 2019(12)

    标签:;  ;  ;  

    基于Lucene的电子档案检索系统的设计与实现
    下载Doc文档

    猜你喜欢