位置相关Web搜索的检索技术研究

位置相关Web搜索的检索技术研究

论文摘要

随着Web信息的爆炸性增长,如何从Web上及时有效地查找到真正所需要的信息,已经成为研究者面临的难题。Web信息检索在这种背景下应运而生并得到迅速发展。越来越多的应用要求返回给用户的检索结果不仅是内容相关的,还必须是与用户当前或提供的地理位置相关的。位置相关的Web搜索能提高搜索结果的准确性,在很多方面具有广泛的应用。 根据查询的用户接口和不同的应用需求,位置相关的Web搜索包括两类典型应用:基于文本的和基于图像的。基于文本的搜索主要是“找出某一位置内或附近的对象”。查询中包括确定的位置信息,该位置信息可以用简单的方式进行描述,如利用文字或者地理坐标等。基于图像的搜索主要是判断“在哪里”,即判断用户感兴趣的对象所在的位置,当用户不能用简单的文字描述该位置或者不知道如何描述的时候,用移动设备拍摄图像并发送搜索请求,服务器通过在图像数据库中进行图像匹配,返回给用户相关的网页或者信息。 本文针对以上两类位置相关的Web搜索进行了研究,分析了在检索过程中各自面临的难点问题,提出了相应的解决策略,以及相关的索引结构和图像匹配算法,给出了系统级解决方案,并构造了系统原型,验证了所提出的策略和相关技术的有效性。 本文的主要研究内容及其创新点如下: 1.提出了一种新的混合索引结构,解决了已有基于文本的位置相关Web搜索的索引所面临的问题。已有的方式是将用户输入的地理词看作普通的文本关键字,利用关键词匹配的方式检索出包含这个词的网页。这种方法的缺陷是:忽略了涉及到某个地方但是没有包含其地名的网页,忽略了同名或者别名的现象,以及忽略了基本的空间关系和地理相关性。所提出的混合索引结构克服了上述缺陷,并提高了检索的效率。理论上的代价

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 研究背景
  • 1.1.1 Web信息检索
  • 1.1.2 基于位置的服务
  • 1.1.3 位置相关的Web搜索
  • 1.1.4 位置相关的Web搜索的典型应用
  • 1.2 本论文的工作
  • 1.2.1 研究工作
  • 1.2.1.1 基于文本的位置相关Web搜索的检索技术
  • 1.2.1.2 基于图像的位置相关Web搜索的检索技术
  • 1.2.2 论文组织
  • 第二章 Web信息检索技术
  • 2.1 引言
  • 2.2 Web信息的查询与检索
  • 2.2.1 数据及其文档形式
  • 2.2.2 多媒体数据内容的描述模型
  • 2.2.3 查询与用户接口
  • 2.2.4 文本索引和搜索
  • 2.2.5 基于内容的多媒体信息检索
  • 2.3 Web搜索引擎的扩展
  • 2.4 Web地理信息检索
  • 2.4.1 地理辞典生成
  • 2.4.2 地理信息抽取
  • 2.4.3 索引结构
  • 2.4.4 检索结果排序
  • 2.4.5 用户界面
  • 2.5 小结
  • 第三章 基于文本的位置相关Web搜索
  • 3.1 引言
  • 3.2 已有工作
  • 3.2.1 Google
  • 3.2.2 Yahoo-Overture
  • 3.2.3 GeoSearch
  • 3.2.4 Geotags.com
  • 3.2.5 Northern Light
  • 3.2.6 Spirit Project
  • 3.3 基于文本的位置相关Web检索中的关键问题
  • 3.3.1 网页地理范围的定义和抽取
  • 3.3.2 索引和查询
  • 3.3.3 排序算法
  • 3.4 位置相关查询的定义
  • 3.4.1 查询类型
  • 3.4.2 查询结构
  • 3.4.3 一种基于对象关系的查询代数的定义
  • 3.4.3.1 stor-algebra的数据结构
  • 3.4.3.2 stor-algebra的代数操作
  • 3.5 一种基于文本的位置相关Web搜索引擎TLEngine的原型实现
  • 3.5.1 系统框架
  • 3.5.2 地理辞典
  • 3.5.3 网页地理范围的分类和抽取
  • 3.5.3.1 网页地理范围的类别定义
  • 3.5.3.2 网页地理范围的抽取
  • 3.5.4 排序
  • 3.5.4.1 位置相关性
  • 3.5.4.2 文本相关性
  • 3.5.4.3 位置相关性和文本相关性的组合模式
  • 3.5.5 查询界面
  • 3.5.6 索引结构
  • 3.5.7 数据集和测试结果
  • 3.6 小结
  • 第四章 TLEngine中的一种混合索引结构
  • 4.1 引言
  • 4.2 相关工作
  • 4.2.1 文本索引技术
  • 4.1.1.1 签名文件
  • 4.1.1.2 后缀树或后缀数组
  • 4.1.1.3 倒排表
  • 4.1.2 空间索引技术
  • *树'>4.1.2.1 R树和R*
  • 4.1.3 索引混合模式
  • 4.3 地理范围的表示
  • 4.4 一种新的混合索引结构
  • *-tree相互独立的索引'>4.4.1 倒排表和R*-tree相互独立的索引
  • *-tree索引结构'>4.4.2 倒排表—R*-tree索引结构
  • *-tree—倒排表索引结构'>4.4.3 R*-tree—倒排表索引结构
  • 4.4.4 三种混合结构的分析比较
  • 4.5 实验
  • 4.5.1 实验设置和数据集
  • 4.5.2 实验结果
  • *-tree和Grid结构的混合索引的比较'>4.5.3 基于R*-tree和Grid结构的混合索引的比较
  • 4.6 小结
  • 第五章 基于图像的位置相关Web搜索
  • 5.1 引言
  • 5.2 已有工作
  • 5.3 基于图像的位置相关Web搜索的关键问题
  • 5.3.1 特征提取
  • 5.3.2 图像匹配算法
  • 5.3.3 近邻查询
  • 5.3.4 高维索引
  • 5.4 本文的解决方案
  • 5.4.1 系统解决方案
  • 5.4.2 特征抽取
  • 5.4.3 索引
  • 5.4.4 数据集和原型实现
  • 5.5 小结
  • 第六章 基于visual parts的图像匹配算法
  • 6.1 引言
  • 6.2 相关工作背景
  • 6.2.1 Scale-invariant Feature Transform(SIFT)
  • 6.2.2 Visual Parts
  • 6.2.3 高维索引和相似查询
  • 6.3 一种基于Visual parts的图像匹配算法
  • 6.3.1 Visual parts的抽取
  • 6.3.2 Visual parts的匹配
  • 6.4 实验
  • 6.4.1 数据集和设置
  • 6.4.2 查询时间分析
  • 6.4.3 准确率和查全率的分析
  • 6.5 小结
  • 第七章 结束语
  • 7.1 论文工作总结
  • 7.2 特色和贡献
  • 7.3 进一步工作
  • 参考文献
  • 攻读博士学位期间发表的学术论文
  • 攻读博士学位期间申请的专利
  • 攻读博士学位期间参加的科研项目
  • 致谢
  • 相关论文文献

    • [1].面向大数据的索引结构研究进展[J]. 大数据 2019(04)
    • [2].一种支持快速相似检索的多维索引结构[J]. 通讯世界 2016(07)
    • [3].一种基于B+树的混合索引结构[J]. 计算机工程 2012(14)
    • [4].一种基于多核机群架构的混合索引结构[J]. 电子学报 2011(02)
    • [5].Intensive KDB-Tree:一种有效的高维数据索引结构[J]. 世界科技研究与发展 2010(01)
    • [6].多格式海量数据统一存取的索引结构[J]. 计算机应用研究 2013(06)
    • [7].基于混合索引结构的传感器网络查询系统仿真[J]. 系统仿真学报 2011(01)
    • [8].索引事业繁荣的标志[J]. 中国索引 2013(04)
    • [9].基于位置的发布/订阅索引结构[J]. 中南民族大学学报(自然科学版) 2019(02)
    • [10].内存数据库索引结构的研究[J]. 中国电力教育 2008(S3)
    • [11].支持k近邻查询的X*树索引结构[J]. 计算机工程与应用 2011(05)
    • [12].一种极小化交叠空间数据索引结构[J]. 哈尔滨工程大学学报 2009(08)
    • [13].一种支持海量跨媒体检索的集成索引结构[J]. 软件学报 2008(10)
    • [14].一种基于索引结构的多语言界面实现方法[J]. 微计算机信息 2010(05)
    • [15].基于双层索引结构的起源图查询方法[J]. 计算机应用 2017(01)
    • [16].云计算环境下空间数据查询关键技术研究[J]. 信息系统工程 2016(11)
    • [17].空间数据库中的一种混合索引结构的研究[J]. 计算机工程与应用 2017(20)
    • [18].对等网络点播系统中一种分布式索引结构[J]. 华中科技大学学报(自然科学版) 2011(03)
    • [19].SLC:基于跳表的可扩展云数据索引(英文)[J]. Journal of Central South University 2018(10)
    • [20].面向可变权值的多特征索引结构[J]. 武汉大学学报(信息科学版) 2010(08)
    • [21].一种空间更优的数据流查询包含编码区间索引[J]. 软件学报 2009(09)
    • [22].基于节点分裂优化的R-树索引结构[J]. 计算机应用研究 2016(12)
    • [23].内存数据库索引技术研究[J]. 科技创新导报 2010(29)
    • [24].CKDB-Tree:一种有效的高维动态索引结构[J]. 计算机工程与应用 2009(30)
    • [25].一种基于DTD的不完全值索引结构[J]. 福州大学学报(自然科学版) 2008(01)
    • [26].HF-Tree:一种闪存数据库的高更新性能索引结构[J]. 计算机研究与发展 2010(05)
    • [27].基于Road R-tree的城市路网索引结构研究[J]. 计算机应用与软件 2009(02)
    • [28].支持MMDB缓存优化的索引结构研究[J]. 桂林理工大学学报 2012(04)
    • [29].文本检索中动态索引技术研究[J]. 韶关学院学报 2011(02)
    • [30].浅谈SQL Server索引结构及其使用[J]. 福建电脑 2010(11)

    标签:;  ;  ;  ;  ;  

    位置相关Web搜索的检索技术研究
    下载Doc文档

    猜你喜欢