基于关键字的模糊查询技术的研究

基于关键字的模糊查询技术的研究

论文摘要

信息产业的飞速发展,使得信息量飞速膨胀,面对海量的数据信息,怎样从中找到需要的有效信息,成为人们研究的热点问题。而随着数据的不断增加,准确而有效的查询变得越来越困难。不但数据中本身就存在一些相似相近的关键字,而且一些输入的错误、数据库中的“脏数据”也会给数据检索带来一定的困难。因此,模糊查询应运而生。目前,很多学者已经提出很多关于模糊查询的算法以及思想,但是,这些算法大部分都是基于前缀匹配的关键字的查询,查询的结果往往差强人意。本文提出了一种新的基于n-gram(即字符串片段)的模糊查询技术,该技术能够保证用户在输入错误或者数据库中存在“脏数据”的情况下,依然能够将有用的信息返回给用户。本文主要介绍了基于这种字符串分割技术的模糊查询的算法实现。主要包括字符串分割的算法实现、基于B+树结构的倒排索引的建立、输入预处理、通过多路归并算法从数据库中找到符合查询条件的候选者,以及最终通过编辑距离算法从候选者中找出符合一定编辑距离的最终结果返回给用户的具体做法,并通过实验平台证实了该思想的可行性。

论文目录

  • 中文摘要
  • Abstract
  • 中文文摘
  • 目录
  • 绪论
  • 一、课题背景
  • 二、国内外概况
  • 三、研究的主要问题及解决方案
  • 四、本课题的意义与价值
  • 五、本文主要研究内容
  • 第一章 基于关键字的模糊查询
  • 第一节 基于关键字的模糊查询
  • 第二节 本文创新点
  • 第二章 基于n-gram的字符串分割技术
  • 第一节 字符串分割技术
  • 第二节 分割字符串的算法实现
  • 第三节 实验结果与算法分析
  • 第四节 本章小结
  • 第三章 索引的创建
  • 第一节 索引技术
  • 第二节 倒排列表与索引技术
  • 第三节 用B+树实现倒排索引
  • 3.1 B+树的定义及特点
  • 3.2 现有算法
  • 3.3 本文改进算法
  • 3.4 算法分析与实验结果
  • 第四节 本章小结
  • 第四章 查询结果的筛选
  • 第一节 输入预处理
  • 第二节 多路归并算法
  • 2.1 Heap
  • 2.2 MergeOpt
  • 2.3 ScanCount
  • 2.4 MergeSkip
  • 2.5 DivideSkip
  • 2.6 算法比较
  • 第三节 编辑距离筛选最终结果
  • 3.1 编辑距离概述
  • 3.2 数据查询结果的筛选
  • 第四节 实验算法分析与比较
  • 第五节 本章小结
  • 第五章 全文总结及展望
  • 第一节 全文总结
  • 第二节 工作展望
  • 参考文献
  • 攻读学位期间承担的科研任务与主要成果
  • 致谢
  • 个人简历
  • 相关论文文献

    • [1].基于多类型-多条件的企业营销综合模糊查询系统的设计与实现[J]. 江苏科技信息 2017(19)
    • [2].大规模混合网络数据库模糊查询算法改进仿真[J]. 计算机仿真 2020(05)
    • [3].可缩放矢量格式地图图层定义及模糊查询模型[J]. 同济大学学报(自然科学版) 2017(06)
    • [4].基于汉语拼音的模糊查询及其在图书馆管理系统中的应用[J]. 计算机应用与软件 2011(05)
    • [5].基于模糊逻辑带权重的模糊查询研究[J]. 计算机应用研究 2009(01)
    • [6].数据库管理系统中的模糊查询技术[J]. 才智 2008(17)
    • [7].关系数据库的模糊优先权查询研究[J]. 湖南科技学院学报 2016(10)
    • [8].ASP.NET动态模糊查询的实现[J]. 电脑编程技巧与维护 2008(14)
    • [9].卡口模糊查询结合特征比对法[J]. 刑事技术 2014(04)
    • [10].一种基于正态分布密度函数的模糊查询方法[J]. 计算机技术与发展 2018(09)
    • [11].基于Matlab的模糊查询表生成方法探讨[J]. 实验室研究与探索 2014(05)
    • [12].RDF数据模糊查询方法研究进展[J]. 计算机科学与探索 2014(11)
    • [13].SQL数据库管理系统中的模糊查询技术[J]. 海南师范大学学报(自然科学版) 2009(02)
    • [14].面向2D对象形状识别的空间模糊查询研究[J]. 计算机工程与应用 2012(16)
    • [15].基于.NET的农业信息模糊查询系统的研究与实现[J]. 农机化研究 2008(04)
    • [16].一种扩展关键词的RDF模糊查询方法[J]. 中国科技论文 2013(10)
    • [17].肿瘤编码模糊查询软件介绍[J]. 中国肿瘤 2013(05)
    • [18].一种基于Neo4j图数据库的模糊查询研究与实现[J]. 计算机技术与发展 2018(11)
    • [19].ICD-O-3与ICD-10肿瘤编码中英文模糊查询系统[J]. 中国肿瘤临床与康复 2013(07)
    • [20].ICD-O-3与ICD-10肿瘤编码中英文模糊查询系统[J]. 中国肿瘤临床与康复 2013(06)
    • [21].基于聚类优化的模糊OLAP查询技术研究[J]. 杭州电子科技大学学报 2013(01)
    • [22].PowerBuilder数据窗口中实现模糊查询[J]. 科技风 2009(12)
    • [23].导弹数据库搜索策略研究与应用[J]. 战术导弹技术 2019(03)
    • [24].上海市徐汇区档案馆提供拼音模糊查询功能[J]. 兰台世界 2010(03)
    • [25].互联网时代校园商铺平台系统的设计与实现[J]. 信息记录材料 2020(06)
    • [26].基于Ajax技术的层次式模糊查询系统设计与实现[J]. 重庆理工大学学报(自然科学版) 2010(09)
    • [27].数据库设计与开发教学过程中存在的问题浅析[J]. 中外企业家 2019(35)
    • [28].军事救生植物检索与鉴别系统的设计与实现[J]. 医疗卫生装备 2016(09)
    • [29].基于模糊聚类分析的数据库模糊查询的研究[J]. 小型微型计算机系统 2015(06)
    • [30].模糊查询中的策略优化[J]. 计算机工程与应用 2008(34)

    标签:;  ;  ;  ;  

    基于关键字的模糊查询技术的研究
    下载Doc文档

    猜你喜欢