面向特定领域的主题搜索技术研究

面向特定领域的主题搜索技术研究

论文摘要

随着互联网的飞速发展,互联网络上的信息量正在以几何级数的速度增长,Internet已经成为目前世界上最大的信息资源库。如何满足人们快速、准确、全面获取信息的需求,已经成为人们面临的一大难题。搜索引擎的出现从一定程度上解决了信息获取问题。但是随着信息多元化的增长,通用搜索引擎越来越难以满足特定用户专业化、个性化、更深入的搜索需求。在这种背景下,近年来面向特定领域的主题搜索技术成为网络信息检索领域的研究热点。本文首先对比介绍了通用搜索引擎和领域主题搜索引擎在系统架构、工作原理、关键技术等方面的异同,分析了面向特定领域主题搜索技术的研究现状和发展方向。随后,研究了主题搜索技术中领域知识库的构建、更新与领域主题识别两项关键技术。重点研究了主题词典的结构和建立方法,以及主题特征模型和页面信息模型的构建过程,并提出了相关算法。接下来,研究了主题网络爬行器的搜索启发策略,对比分析了几种典型搜索算法,并提出了基于综合价值搜索策略。在此基础上,设计了一个主题网络爬行器。最后,在以上研究内容基础上,实现了一个面向特定领域的主题搜索引擎原型系统。该系统不仅能够准确自动地爬行到主题相关的网页,而且还可以节约网络带宽,具有良好的稳定性。该系统通过一些典型实验,验证了系统在查全率、查准率、主题满意度等评价指标上都达到了较高水平并取得了良好的效果。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.3 本论文的主要工作
  • 1.4 论文的组织结构
  • 第2章 主题搜索相关理论和技术
  • 2.1 通用搜索引擎
  • 2.1.1 搜索引擎的分类
  • 2.1.2 搜索引擎的工作原理
  • 2.1.3 搜索引擎相关技术
  • 2.2 主题搜索引擎
  • 2.2.1 领域主题搜索引擎基本架构
  • 2.2.2 领域主题搜索引擎的关键技术
  • 2.3 本章小结
  • 第3章 主题搜索引擎关键实现技术研究
  • 3.1 领域知识库建立及更新技术
  • 3.1.1 领域主题词典的构建
  • 3.1.2 领域主题词典的动态更新
  • 3.2 领域主题识别技术
  • 3.2.1 Web页面的主题特征
  • 3.2.2 向量空间模型介绍
  • 3.2.3 主题特征模型的建立
  • 3.2.4 页面信息模型的建立
  • 3.2.5 主题识别算法的选择
  • 3.3 本章小结
  • 第4章 主题网络爬行器的设计
  • 4.1 主题爬行器工作原理
  • 4.2 主题网络爬行器的搜索策略
  • 4.2.1 基于链接的搜索策略
  • 4.2.2 基于内容评价的搜索策略
  • 4.2.3 基于内容和链接的综合性搜索策略
  • 4.3 主题网络爬行器的设计与实现
  • 4.3.1 爬行器系统结构设计
  • 4.3.2 主题种子链接的初始化
  • 4.3.3 爬行器的搜索启发策略
  • 4.3.4 主题相关度的计算方法
  • 4.3.5 爬行器设计的其它问题
  • 4.4 本章小结
  • 第5章 原型系统实验与结果分析
  • 5.1 开源系统Nutch介绍
  • 5.2 原型系统体系结构
  • 5.3 实验平台与运行环境
  • 5.4 实验评价指标
  • 5.5 实验与结果分析
  • 5.5.1 系统实验领域定制
  • 5.5.2 实验结果与分析
  • 5.5.3 系统评价与总结
  • 5.6 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].敏感火箭弹自主搜索技术研究[J]. 弹箭与制导学报 2017(06)
    • [2].沈向洋:搜索技术的新疆界[J]. 中国教育网络 2008(06)
    • [3].完美的搜索技术[J]. 互联网天地 2009(07)
    • [4].EBSCO推出新的显示和搜索技术[J]. 现代图书情报技术 2009(Z1)
    • [5].FAST搜索技术及其应用研究[J]. 中国索引 2008(04)
    • [6].智能搜索引擎中付费搜索技术研究[J]. 数字技术与应用 2012(06)
    • [7].微博搜索技术及隐私安全问题的研究[J]. 电子世界 2016(21)
    • [8].搜索的未来[J]. IT经理世界 2010(18)
    • [9].高校校园网资源搜索技术研究[J]. 计算机与信息技术 2008(09)
    • [10].分层搜索技术应用于配电网可靠性评估的研究[J]. 福建电力与电工 2008(03)
    • [11].数字内容智能云处理和云搜索技术[J]. 中国科技信息 2016(14)
    • [12].开源对软件工程的作用及关键搜索技术分析[J]. 微型机与应用 2015(24)
    • [13].运用搜索技术提升产品营销服务能力[J]. 中国城市金融 2012(07)
    • [14].对未来Google搜索技术的深度分析[J]. 中国传媒科技 2010(07)
    • [15].学校网络安全体系应用中的网络拓扑搜索技术[J]. 网络财富 2010(14)
    • [16].图像购物搜索技术研究综述[J]. 计算机系统应用 2016(06)
    • [17].2009年上半年中国舆情报告(上)——基于第三代网络搜索技术的舆情研究[J]. 山西大学学报(哲学社会科学版) 2010(01)
    • [18].2009年上半年中国舆情报告(下)——基于第三代网络搜索技术的舆情研究[J]. 山西大学学报(哲学社会科学版) 2010(02)
    • [19].找到你的脸——智能图片搜索技术[J]. 互联网天地 2009(02)
    • [20].极客说[J]. 中国经济和信息化 2011(10)
    • [21].智能化报表搜索技术的研究与实现[J]. 电子器件 2020(05)
    • [22].沈阳宝通软件科技有限公司 专注搜索技术研发与生产[J]. 科技成果纵横 2008(S1)
    • [23].浅析大数据搜索引擎之图片搜索技术[J]. 电脑知识与技术 2019(34)
    • [24].位置搜索关键技术研究[J]. 电信科学 2012(03)
    • [25].创新的“流”和“源”[J]. 21世纪商业评论 2012(12)
    • [26].基于元搜索技术的主题新闻门户系统[J]. 计算机系统应用 2009(11)
    • [27].高效时序相似搜索技术[J]. 计算机学报 2009(11)
    • [28].SPH中的内外单元粒子搜索技术[J]. 水动力学研究与进展A辑 2008(03)
    • [29].搜索技术在电子商务中的应用研究[J]. 才智 2014(25)
    • [30].网络商品信息元搜索技术研究与应用[J]. 计算机应用与软件 2014(04)

    标签:;  ;  ;  ;  

    面向特定领域的主题搜索技术研究
    下载Doc文档

    猜你喜欢