基于社会化标签的个性化搜索研究

基于社会化标签的个性化搜索研究

论文摘要

在互联网技术的推动下搜索引擎的应用日趋成熟,各式搜索引擎也已成为人们在信息过载的互联网中搜寻信息时的有利工具。然而随着人们对信息的个性化要求越来越高,也对搜索引擎的搜索效果提出了更高的要求。Web2.0及其相关技术的出现为整个互联网带来了一个新的惊喜,其中最具代表的社会化标注(Social Annotation)为提高搜索引擎个性化服务质量带来了新的契机。搜索引擎的个性化方面的研究,集中在如何准确有效的获取用户的个性化特征,及如何根据获取的用户偏好为其提供个性化服务。本文首先全面分析了传统的Web日志挖掘中的关键技术,总结了传统日志挖掘在用户数据获取、数据过滤、模型表示、模型学习及更新的主要方法。在分析出传统web日志挖掘中存在的问题后,本文结合传统的Web日志挖掘方法及对社会化标签数据的处理来获取用户的特征,并据此对用户进行个性化推荐和贡献。社会化标签网带来的是由用户主动标识过的信息资源,相比较传统的Web日志挖掘而言,从这些信息资源中学习用户的偏好特征必然更为客观和准确。其次用户标注行为的本身也具有可挖掘性,用户对某一类资源的标注的频繁度映射了其对这一兴趣点的关注程度;用户在某一类资源中总是可以较早的发现一些质量高的资源,那么依据此特征可以把这些资源推荐给具有相同兴趣的其他用户。论文的主要工作包括以下方面。(一)利用矩阵分别对用户的历史搜索记录和用户标注数据进行描述,并对用户搜索和标注中的关键term进行时间维上的描述。通过由搜索数据及标注数据构建的矩阵最终刻画描述用户的特征模型。(二)基于用户特征的表示探讨了现有的主要用户模型的学习和更新方法,并结合其优点针对其不足提出一种自适应的用户模型的学习方法。(三)在获得用户特征后,针对一般性用户的数据稀松问题提出一种基于协同过滤的个性化推荐;以及根据用户标注行为本身与一般用户特征相结合的方法为用户提供个性化共享服务。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 论文的选题背景和研究意义
  • 1.1.1 选题背景
  • 1.1.2 研究意义
  • 1.2 论文的研究内容、主要工作及创新点
  • 1.2.1 论文的研究内容
  • 1.2.2 论文的主要工作及创新点
  • 1.3 论文的内容组织
  • 2. 相关工作
  • 2.1 Web 数据挖掘研究
  • 2.1.1 Web 内容挖掘
  • 2.1.2 Web 结构挖掘
  • 2.1.3 Web 使用挖掘
  • 2.2 个性化搜索研究
  • 2.2.1 个性化搜索研究现状及存在的问题
  • 2.2.2 个性化搜索目前的主要方法
  • 2.3 用户特征模型的研究
  • 2.3.1 用户特征模型的研究现状及存在的问题
  • 2.3.2 用户特征模型的主要技术
  • 3 基于社会化标签的用户特征模型的构建
  • 3.1 社会化标签的主要技术
  • 3.2 基于社会化标签用户特征模型构建方法
  • 3.2.1 Tag Cloud (标签云)
  • 3.2.2 Query-Tag-Tree (查询-标签-树)
  • 3.3 基于社会化标签用户特征的表示
  • 3.3.1 基于用户搜索记录数据的用户特征表示
  • 3.3.2 基于用户标注行为数据的用户特征表示
  • 3.4 基于社会化标签用户特征模型的学习
  • 3.4.1 Rocchio 算法
  • 3.4.2 LLSF 算法(Linear Least Squares Fit)
  • 3.4.3 KNN 算法
  • 3.4.4 Adaptive Learning 算法
  • 4 基于社会化标签的用户个性化推荐
  • 4.1 基于一般用户特征的推荐
  • 4.2 基于用户特征的推荐
  • 4.3 基于一般特征与用户特征相结合的推荐
  • 4.4 基于社会化标签的协同过滤推荐
  • 4.5 实验
  • 4.5.1 数据准备
  • 4.5.2 实验结果分析与评估
  • 5 总结与展望
  • 参考文献
  • 致谢
  • 攻读硕士期间发表论文情况
  • 相关论文文献

    • [1].压敏标签供送装置中剥离机构的设计[J]. 河南科技 2019(34)
    • [2].浅议通过标签查找“问题”农药[J]. 种子科技 2019(17)
    • [3].图像多标签学习的研究概述[J]. 南京信息工程大学学报(自然科学版) 2019(06)
    • [4].医院中药房成药定位标签的设计与评价[J]. 中医药管理杂志 2020(01)
    • [5].基于大数据的患者画像标签体系构建方法及应用研究[J]. 中国卫生信息管理杂志 2019(06)
    • [6].基于标签语义挖掘的城市画像感知研究[J]. 数据分析与知识发现 2019(12)
    • [7].RFID标签及其加工应用浅谈[J]. 印刷杂志 2020(02)
    • [8].基于深度学习的多标签生成研究进展[J]. 计算机科学 2020(03)
    • [9].饲料标签常见问题及分析讨论[J]. 饲料博览 2020(02)
    • [10].芬欧蓝泰标签的新型纸质标签材料包含可回收成分[J]. 网印工业 2020(05)
    • [11].警情热点标签的设计和应用[J]. 大众标准化 2020(07)
    • [12].探讨无线发射台站标签规范化[J]. 视听 2020(03)
    • [13].一种基于标签融合的微博主题生成方法[J]. 辽东学院学报(自然科学版) 2020(02)
    • [14].钢材成品二维码标签系统设计[J]. 包钢科技 2020(03)
    • [15].通过标签嵌入从社交标签中挖掘上下位关系[J]. 指挥信息系统与技术 2020(04)
    • [16].多类别相关性结合的类属属性多标签学习[J]. 模式识别与人工智能 2020(08)
    • [17].基于标签相关性的类属属性多标签分类算法[J]. 计算机应用研究 2020(09)
    • [18].用行动擦亮爱国奉献的人生标签[J]. 新长征 2019(01)
    • [19].标签的“前世今生”[J]. 今日印刷 2019(03)
    • [20].欧盟转基因食品标签粘贴制度研究及启示[J]. 包头职业技术学院学报 2015(04)
    • [21].多语言高质量社会化标签生成与聚类[J]. 现代图书情报技术 2015(10)
    • [22].区分标签质量的机器生成标签聚类研究[J]. 现代图书情报技术 2015(10)
    • [23].美修订能源标签新规则[J]. 中国洗涤用品工业 2016(01)
    • [24].多标签环境下RFID系统的受限链路[J]. 电子测量技术 2016(01)
    • [25].竞岗年轻干部如何快速摘掉“花瓶”标签[J]. 领导科学 2016(16)
    • [26].对残疾标签的回应与超越[J]. 现代特殊教育 2016(12)
    • [27].一种获取标签相关信息的多标签分类方法[J]. 计算机工程与应用 2016(14)
    • [28].国内外社会化标签挖掘研究综述[J]. 图书情报工作 2014(21)
    • [29].绚丽出你的个性标签[J]. 快乐作文 2020(Z4)
    • [30].“匠心签韵 智慧共赢”2020亚洲标签大奖正式启动[J]. 标签技术 2020(01)

    标签:;  ;  ;  ;  ;  

    基于社会化标签的个性化搜索研究
    下载Doc文档

    猜你喜欢