基于链接分析的Blog网页排序算法的研究

基于链接分析的Blog网页排序算法的研究

论文摘要

博客作为一种个人发布工具,逐渐成为信息时代不可或缺的资源,随着社会网络的高速发展和社会化软件的普及,互联网正逐步跨入社区时代,博客吸引了越来越多的人的目光,数以百万计的用户开始使用Blog发布信息。在博客用户飞速增长的同时,也带来了博客空间的急剧膨胀。因此,以从海量的Blog信息中挖掘到满足用户需求信息为目的的博客搜索技术,日益发展壮大。作为博客搜索最为关键的博客排序算法,更是成为Blog领域的研究热点,得到了广泛的关注。本文在详细分析博客网页的结构特点和功能特性及链接分析相关技术的基础上,主要针对Blog网页区别于传统网页的结构特点,通过将Blog的链接关系进行分类,提出专门应用于Blog网页的排序算法。具体的做法是:首先通过分析Blog结构特点,选择影响Blog排序的特征因素,这些因素包括Trackback、标签、评论等。其次对特征因素进行提取。提取特征时,先进行网页净化,去除噪音网页,然后通过模板匹配的方式提取特征因子。最后,在此基础上使用基于链接分析的Blog排序算法对Blog网页进行排序。在对Blog网页排序时,首先将链接关系进行分类,分为结构型连接Trackback链接和内容链接,即网页内部链接,并分别提出相应的权重计算排序算法,最终的排序算法为二者的结合。对于结构链接,创新性的提出了从Blog作者知名度角度来考察Blog文章的最终排序结果,在最新发布的Blog日志没有或者鲜有链接的情况下,根据作者以往的贡献来评价该日志的排序得分。对于内容链接,在继承传统的PageRank算法的马尔科夫迭代过程的同时,对有相同标签、分类的日志给予了较高的关注,同时兼顾了Blog的时新性,全面考虑了影响Blog排序的因素。经过实验对算法进行测试和分析,表明本文提出的方法,相较之其他博客网页排序算法,极大的提高了排序结果的查询相关性。同时,实验还表明本文算法对反映当前热点查询的效果更为显著。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景与意义
  • 1.2 国内外现状
  • 1.3 研究内容与组织结构
  • 第2章 相关技术研究
  • 2.1 Blog相关技术
  • 2.1.1 Blog的特点
  • 2.1.2 Blog的关键技术
  • 2.2 链接分析排序技术
  • 2.2.1 链接分析原理
  • 2.2.2 链接分析模型
  • 2.2.3 链接分析排序算法
  • 第3章 基于链接分析的Blog排序算法
  • 3.1 影响Blog排序的因素
  • 3.2 Blog网页预处理
  • 3.2.1 Blog网页噪声过滤
  • 3.2.2 Blog排序特征提取
  • 3.2.3 链接关系提取
  • 3.3 基于链接分析的Blog排序算法
  • 3.3.1 基于结构链接的TBR排序算法
  • 3.3.2 基于内容链接的BPR排序算法
  • 3.3.3 算法整合
  • 第4章 算法测试与性能分析
  • 4.1 评测环境
  • 4.1.1 数据集
  • 4.1.2 试验环境
  • 4.2 评测标准
  • 4.3 试验结果与分析
  • 第5章 结论与展望
  • 5.1 工作总结
  • 5.2 进一步工作
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].高中物理Blog教研中存在的问题及解决策略[J]. 中国教育技术装备 2017(05)
    • [2].以Blog为平台的教育叙事研究与教师专业化发展[J]. 文教资料 2011(20)
    • [3].Blog在图书馆参考咨询工作中的应用[J]. 河南科技学院学报 2013(11)
    • [4].Blog在教师个人知识管理中的应用研究[J]. 中国科教创新导刊 2009(08)
    • [5].Blog档案袋评价的设计与实施[J]. 考试周刊 2011(45)
    • [6].草根的盛宴——基于Blog的教育叙事研究[J]. 时代教育(教育教学版) 2008(08)
    • [7].基于BLOG的艺术类学生网络交流应用研究[J]. 网友世界 2014(10)
    • [8].基于概率潜在语义分析的Blog个性化查询扩展研究[J]. 安阳师范学院学报 2013(02)
    • [9].基于Blog和Blog群组的网络协作学习研究[J]. 周口师范学院学报 2012(04)
    • [10].试论基于Blog的教育叙事与教师专业发展[J]. 科技视界 2012(33)
    • [11].Blog在医学信息检索教学中的辅助作用[J]. 医学信息学杂志 2011(07)
    • [12].基于Blog的教育叙事与教师专业发展研究[J]. 东方企业文化 2011(08)
    • [13].中学图书馆Blog应用现状及启示[J]. 图书情报工作 2011(S1)
    • [14].Blog在高等职业教育中的应用[J]. 电脑知识与技术 2010(11)
    • [15].基于博客(BLOG)的背越式跳高技术教学探索与实践[J]. 运城学院学报 2010(02)
    • [16].基于BLOG平台的教育叙事研究[J]. 河南科技学院学报(自然科学版) 2010(01)
    • [17].Blog——《文献检索与利用》课教学的辅助工具[J]. 情报探索 2010(05)
    • [18].博客(Blog)在“过程写作法”中的作用探究[J]. 长春理工大学学报(高教版) 2009(08)
    • [19].Blog在网络信息服务中的应用研究[J]. 潍坊学院学报 2009(04)
    • [20].基于博客(Blog)的过程写作法新探[J]. 陕西教育(高教版) 2009(05)
    • [21].博客(Blog)对大学生思想政治教育的影响及其对策[J]. 湖南医科大学学报(社会科学版) 2008(01)
    • [22].博客(Blog)技术在大学英语写作教学中的应用[J]. 西北医学教育 2008(05)
    • [23].博客(Blog)在成人教育中的应用研究[J]. 科技信息(学术研究) 2008(02)
    • [24].存在理论与blog虚拟学习社区的构建[J]. 湖北广播电视大学学报 2008(02)
    • [25].基于Blog的高校图书馆个性化服务[J]. 科技情报开发与经济 2008(17)
    • [26].博客(Blog)在图书馆中的应用探讨[J]. 电脑知识与技术 2008(19)
    • [27].基于Blog平台的高校学习型图书馆建设之思考[J]. 长春师范学院学报(自然科学版) 2008(08)
    • [28].基于BLOG的企业默会知识共享探讨[J]. 现代商贸工业 2008(09)
    • [29].Blog在初中物理教学中的应用[J]. 新课程(上) 2011(11)
    • [30].论Blog在个人知识管理中的应用[J]. 科技创新导报 2011(08)

    标签:;  ;  ;  ;  ;  

    基于链接分析的Blog网页排序算法的研究
    下载Doc文档

    猜你喜欢