分布式全文检索中缓存系统研究与实现

分布式全文检索中缓存系统研究与实现

论文摘要

缓存技术是提高响应速度、处理效率及系统性能的关键性技术,在分布式全文检索过程中,具有重要的应用价值。研究分布式全文检索中的缓存技术,具有很高的理论价值和应用基础。本课题通过分析用户查询行为,设计了基于用户查询日志的缓存系统,经实验测试,此系统在提高舆情采集系统查询响应时间和处理效率,以及改善舆情采集系统搜索引擎性能上,具有良好效果。根据舆情采集系统实际情况和具体需求,设计了分布式缓存系统的体系结构,重点包括分布式缓存系统协作机制、数据同步、缓存结构和替换算法等关键环节。在本论文中,设计了双级缓存结构。在此结构中采用了静态和动态两种不同类型缓存,通过统计用户查询行为规律,提取查询热度最高的一部分查询,对缓存数据进行初始化分配。处理用户查询时,检索次序为静态缓存、动态缓存和底层索引库。由于静态缓存中存放热度最高的查询,并采取动态缓存辅助,结合行之有效的缓存替换算法,在命中率、缓存效率和时间开销等指标上,与采用其它缓存结构的分布式缓存系统相比,理论和实验上均有一定优势。同时,通过分析传统缓存替换算法理论基础和优缺点,在LRU算法和LFU算法基础上,提出一个基于评分机制的缓存替换算法。该算法兼顾了静态缓存和动态缓存间替换,以及动态缓存内替换两方面。与单纯采用传统动态缓存替换算法相比,命中率更优。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题研究背景和意义
  • 1.2 国内外研究现状
  • 1.3 本文的主要研究内容
  • 1.4 论文结构安排
  • 第2章 分布式缓存系统体系结构设计
  • 2.1 引言
  • 2.2 舆情采集系统需求与体系结构分析
  • 2.2.1 舆情采集系统需求分析
  • 2.2.2 舆情采集系统架构简介
  • 2.2.3 舆情采集系统优化分析
  • 2.3 分布式缓存系统设计
  • 2.3.1 分布式缓存系统拓扑结构
  • 2.3.2 缓存系统体系结构
  • 2.4 各功能模块
  • 2.4.1 查询热度值计算模块
  • 2.4.2 双级缓冲区设计与实现
  • 2.4.3 缓存操作模块
  • 2.4.4 通信协议及差错控制
  • 2.4.5 缓存系统协作功能
  • 2.4.6 缓存系统数据同步机制
  • 2.5 系统测试与实验过程
  • 2.5.1 实验环境介绍和搭建
  • 2.5.2 测试核心思想
  • 2.5.3 实验数据与结果分析
  • 2.6 本章小结
  • 第3章 基于用户查询日志分析的双级缓存结构
  • 3.1 查询重复性及热点分布特征分析
  • 3.2 双级缓存结构
  • 3.2.1 缓存结构设计思想与具体实现
  • 3.2.2 双级缓存结构的特点
  • 3.3 缓存数据分布策略
  • 3.4 双级缓存结构性能理论分析与实验测试
  • 3.4.1 理论分析
  • 3.4.2 实验数据及分析
  • 3.5 本章小结
  • 第4章 基于评分机制的缓存替换算法
  • 4.1 传统缓存替换算法分析
  • 4.1.1 传统缓存替换算法分类
  • 4.1.2 传统缓存替换算法介绍
  • 4.2 基于评分机制的缓存替换算法设计
  • 4.2.1 缓存对象评分公式
  • 4.2.2 缓存对象评分字段初始化与状态变化
  • 4.2.3 静态缓存与动态缓存间替换机制
  • 4.2.4 动态缓存内替换策略
  • 4.3 基于评分机制的缓存替换算法工作流程
  • 4.4 实验数据及结果分析
  • 4.5 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].告读者[J]. 国际汉语学报 2016(01)
    • [2].告读者[J]. 国际汉语学报 2016(02)
    • [3].欢迎订购《中国实用内科杂志》25周年全文检索光盘[J]. 中国实用内科杂志 2009(02)
    • [4].欢迎订购《中国实用内科杂志》25周年全文检索光盘[J]. 中国实用内科杂志 2009(04)
    • [5].SQL Server 2005全文检索在数据查询中的应用[J]. 电脑编程技巧与维护 2010(20)
    • [6].媒体资料库的全文检索效率提升[J]. 中国传媒科技 2008(09)
    • [7].实时反馈信息在全文检索优先排序中的应用[J]. 湖北档案 2010(Z1)
    • [8].数据库全文检索方案的研究[J]. 上海师范大学学报(自然科学版) 2010(02)
    • [9].消息[J]. 中国医学影像技术 2019(11)
    • [10].数据库全文检索方法探析[J]. 无线互联科技 2012(11)
    • [11].商务印书馆将推出全文检索民国期刊数据库[J]. 语文教学与研究 2013(25)
    • [12].SQL Server2008中全文检索的实现[J]. 数字技术与应用 2010(12)
    • [13].全文检索25史(电子版)与历史教学[J]. 历史教学(高校版) 2009(03)
    • [14].海量文档桌面全文检索终端设计与实现[J]. 现代计算机(专业版) 2018(33)
    • [15].使用Scrum框架管理全文检索项目[J]. 电子技术与软件工程 2014(15)
    • [16].安徽高速收费稽查分析中Elasticsearch应用研究[J]. 中国交通信息化 2020(01)
    • [17].基于Whoosh的空间数据全文检索方法[J]. 地理空间信息 2017(11)
    • [18].全文检索模型的检索性能研究[J]. 电脑知识与技术 2010(04)
    • [19].《石油钻探技术》编辑部向部分读者、作者赠送本刊全文检索光盘[J]. 石油钻探技术 2008(02)
    • [20].利用Hibernate快捷实现全文检索[J]. 办公自动化 2008(10)
    • [21].企业数据云存储的机密性与密文全文检索研究[J]. 黑龙江科技信息 2016(30)
    • [22].基于Lucene的全文检索的研究及实现[J]. 电脑知识与技术 2018(10)
    • [23].基于Lucene的全文检索的研究及实现[J]. 电脑知识与技术 2018(11)
    • [24].SPARK技术在海洋档案全文检索中的应用[J]. 科教文汇(下旬刊) 2019(08)
    • [25].《北京党史》(1982—2011)全文检索数据光盘出版[J]. 北京党史 2012(06)
    • [26].基于Lucene的多源数据全文检索的研究与实现[J]. 现代计算机(专业版) 2018(22)
    • [27].基于Lucene全文检索技术的优化探讨[J]. 计算机时代 2017(11)
    • [28].基于Spark SQL的分布式全文检索框架的设计与实现[J]. 计算机科学 2018(09)
    • [29].E数据时代稿本文献整理的必要性[J]. 读书 2015(12)
    • [30].基于Lucene的全文检索管理系统设计与实现[J]. 长江大学学报(自科版) 2014(22)

    标签:;  ;  ;  ;  ;  

    分布式全文检索中缓存系统研究与实现
    下载Doc文档

    猜你喜欢