教育资源共享系统中全文检索技术的研究

教育资源共享系统中全文检索技术的研究

论文摘要

教育资源的共享技术已经成为现代网络教育技术领域的热点。而如何准确定位和检索到消费者所需要的教育资源是当今信息检索技术研究的关键。首先,本文探讨了倒排索引、索引构造和维护、索引压缩存储和检索算法等关键技术。对检索算法进行改进,采用跳跃指针来减少扫描记录的次数,从而加快检索速度。其次,针对关系数据库对非结构化数据索引和检索速度慢的问题,提出了全文数据库和关系数据库相结合的数据库设计方案,提高了数据索引和检索性能,实现了对资源和索引库的有效管理。最后,以Lucene全文检索技术框架为基础,根据教育资源共享的实际需要,设计了全文检索的技术架构和系统模型,实现教育资源的定义和分类、数据的加工和处理、索引的建立、全文数据的检索等主要功能模块,同时对检索结果进行评分排序,实现了具有检索、浏览和下载功能的教育资源全文检索子系统。实验结果表明索引和检索性能达到了系统的设计要求。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究背景、来源及现状
  • 1.1.1 课题研究背景及来源
  • 1.1.2 全文信息检索技术现状
  • 1.2 信息检索技术面临的挑战
  • 1.3 本文主要研究内容和工作
  • 1.4 本文的组织
  • 第二章 教育资源共享体系结构分析与设计
  • 2.1 教育信息资源定义和分类
  • 2.2 教育资源共享系统体系结构
  • 第三章Lucene 全文检索技术研究
  • 3.1 Lucene 数据源解析与索引
  • 3.1.1 数据源解析
  • 3.1.2 索引的建立与全文检索
  • 3.2 中文切词解决方案
  • 3.2.1 中文信息检索算法
  • 3.2.2 检索词首字直接匹配算法
  • 第四章 全文检索关键技术与检索算法改进
  • 4.1 索引构造算法研究
  • 4.1.1 传统倒排索引
  • 4.1.2 索引构造算法和索引维护
  • 4.1.3 索引压缩存储算法研究
  • 4.2 检索算法的改进和结果排序
  • 4.2.1 Lucene 检索算法及其改进
  • 4.2.2 相似度计算和结果排序
  • 第五章 基于文件系统的全文数据库设计
  • 5.1 全文数据库功能设计
  • 5.2 关系数据库系统弊端研究
  • 5.3 基于文件系统的构建方案
  • 第六章 教育资源全文检索系统设计与实现
  • 6.1 系统概述
  • 6.1.1 系统简介
  • 6.1.2 系统实现目标
  • 6.2 全文检索系统总体设计
  • 6.2.1 全文检索系统的体系结构
  • 6.2.2 系统实现平台及开发工具
  • 6.3 全文数据库实现
  • 6.3.1 文本数据库的建立
  • 6.3.2 索引库的建立
  • 6.3.3 关系数据库后台管理实现
  • 6.4 数据加工及文本数据的实现
  • 6.5 全文数据索引与性能测试
  • 6.6 全文数据检索
  • 6.7 结果处理与检索性能测试
  • 6.7.1 检索结果评分和排序
  • 6.7.2 运行结果
  • 6.7.3 检索性能测试对比与分析
  • 第七章 总结和展望
  • 7.1 对本文工作的总结
  • 7.2 未来研究展望
  • 致谢
  • 参考文献
  • 读研期间研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    教育资源共享系统中全文检索技术的研究
    下载Doc文档

    猜你喜欢