搜索引擎检索技术研究

搜索引擎检索技术研究

论文摘要

随着Internet迅猛发展,搜索引擎已经成为人们进行信息获取必不可少的工具。检索技术作为搜索引擎的核心技术之一,对信息准确、快速地获取起到了至关重要的作用。本文在传统向量空间模型的基础上,提出了一种改进的向量空间模型,该模型充分考虑了文档结构对词的重要性的影响,利用该模型进行相似度计算时,避免了向量空间模型查全率和查准率不高的缺点。在检索模型和缓存技术研究基础上,设计并实现了一个高效的检索系统,该检索系统包括查询器和缓存机制两个部分:查询器实现了简单查询和复杂查询两种查询方式;缓存机制制定了基于LRU和LFU的两种基本缓存策略,并采用哈希表缓存查找算法提高缓存查找效率。实验结果表明本文设计的检索系统的检索性能和缓存性能,都达到了实用的水平。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题研究的目的和意义
  • 1.2 国内外研究现状
  • 1.3 论文的主要内容和贡献
  • 1.4 论文结构
  • 第二章 搜索引擎技术
  • 2.1 搜索引擎的分类
  • 2.1.1 目录式搜索引擎
  • 2.1.2 机器人搜索引擎
  • 2.1.3 元搜索引擎
  • 2.2 搜索引擎的工作原理和体系结构
  • 2.2.1 搜索引擎的工作原理
  • 2.2.2 搜索引擎的体系结构
  • 2.3 相关技术
  • 2.3.1 网络爬虫技术
  • 2.3.2 索引技术
  • 2.3.3 排序技术
  • 2.3.4 缓存技术
  • 2.4 搜索引擎的发展趋势
  • 第三章 信息检索模型
  • 3.1 传统信息检索模型
  • 3.2 向量空间模型的优缺点
  • 3.3 改进的向量空间模型
  • 3.4 性能测试及对比分析
  • 3.5 本章小结
  • 第四章 检索系统的设计与实现
  • 4.1 功能分析及整体设计
  • 4.2 检索系统查询器的设计与实现
  • 4.2.1 查询器的结构及功能
  • 4.2.2 接口程序
  • 4.2.3 词典维护
  • 4.2.4 查询实现
  • 4.3 检索系统缓存机制的设计与实现
  • 4.3.1 缓存机制的系统结构
  • 4.3.2 缓存区管理器
  • 4.3.3 缓存区
  • 4.3.4 缓存性能测试与分析
  • 4.4 系统性能测试与分析
  • 4.4.1 衡量指标
  • 4.4.2 查全率和查准率
  • 4.4.3 响应时间
  • 4.4.4 系统运行情况
  • 4.5 本章小结
  • 第五章 总结与展望
  • 致谢
  • 参考文献
  • 读研期间研究成果
  • 相关论文文献

    • [1].一种面向语义检索的向量空间模型改进方法[J]. 农业网络信息 2012(10)
    • [2].基于跨语言广义向量空间模型的跨语言文档聚类方法[J]. 中文信息学报 2012(02)
    • [3].基于情感向量空间模型的歌词情感分析[J]. 中文信息学报 2010(01)
    • [4].基于本体兴趣特征向量空间模型的社区自组织算法[J]. 系统工程 2009(05)
    • [5].基于向量空间模型的短文本密文检索方法[J]. 计算机工程与设计 2017(11)
    • [6].向量空间模型的信息检索技术[J]. 价值工程 2013(13)
    • [7].概念向量空间模型在智能答疑系统中的应用[J]. 安徽工业大学学报(自然科学版) 2008(02)
    • [8].基于词向量的向量空间模型的改进[J]. 现代计算机(专业版) 2018(36)
    • [9].共现潜在语义向量空间模型的进一步研究[J]. 情报杂志 2017(12)
    • [10].基于向量空间模型结合语义的文本相似度算法[J]. 现代电子技术 2018(11)
    • [11].基于鉴别性向量空间模型的语种识别[J]. 清华大学学报(自然科学版) 2013(06)
    • [12].使用向量空间模型进行信息检索的实现[J]. 华南金融电脑 2008(10)
    • [13].核向量空间模型在电能质量综合评估中的应用[J]. 电力系统保护与控制 2012(01)
    • [14].基于向量空间模型的信息检索技术研究[J]. 现代电子技术 2012(11)
    • [15].一种基于向量空间模型的信息检索算法研究[J]. 通讯世界 2018(09)
    • [16].基于情感特征向量空间模型的中文商品评论倾向分类算法[J]. 计算机应用与软件 2016(08)
    • [17].向量空间模型文本建模的语义增量化改进研究[J]. 现代图书情报技术 2014(10)
    • [18].基于主题标签的在线社区话题发现[J]. 系统工程 2017(07)
    • [19].基于N层向量空间模型和两重过滤方法的文本过滤系统的研究[J]. 科技信息 2009(32)
    • [20].一种基于向量空间模型的主观题批改算法[J]. 计算机与现代化 2008(12)
    • [21].基于层次向量空间模型的用户兴趣建模研究[J]. 现代计算机(专业版) 2010(06)
    • [22].基于向量空间模型的信息检索系统的研究与实现[J]. 长春大学学报 2009(08)
    • [23].基于向量空间模型的问答题智能化评分系统[J]. 电脑知识与技术 2008(01)
    • [24].一种基于词义和词频的向量空间模型改进方法[J]. 计算机应用研究 2019(05)
    • [25].基于向量空间模型的网页过滤分析[J]. 电子技术与软件工程 2016(12)
    • [26].基于N层向量空间模型的装备IETM数据查询[J]. 装甲兵工程学院学报 2015(01)
    • [27].基于向量空间模型中文农业网页分类技术研究[J]. 新疆农业大学学报 2012(02)
    • [28].基于情感向量空间模型的歌曲情感标签预测模型[J]. 中文信息学报 2012(06)
    • [29].基于二维向量空间模型的农业技术智能问答系统研究[J]. 江苏农业科学 2012(07)
    • [30].基于WVTool的文本向量空间模型研究与实现[J]. 电脑编程技巧与维护 2012(05)

    标签:;  ;  ;  ;  

    搜索引擎检索技术研究
    下载Doc文档

    猜你喜欢