基于社会网络的链接预测和社区挖掘的研究

基于社会网络的链接预测和社区挖掘的研究

论文摘要

随着社交时代的来临,基于社会网络的研究越来越受到人们的关注,例如社会化的推荐系统和社团发现。社会网络为这些研究领域带来全新的信息。研究者希望通过对社会网络的挖掘,能够得到更加合理的结果,为人们的决策提供更多的帮助。本文就社会化推荐系统的构建和社团发现问题进行了研究,并提出了相关的算法。本文针对社会化推荐系统构建的问题,提出了一个基于信任关系的协同过滤算法框架,将用户可信度和传统的评分相似度有机地结合在一起,以此为用户做出更加合理的推荐。本文认为现代推荐系统应该充分考虑社会因素的影响,而人与人之间的信任关系正是一个重要的社会因素。由于数据稀疏性的问题,本文对信任网络进行聚类,并赋予每个用户一个类层级的可信度。在Epinions数据集上的实验,证明了利用用户信任关系可以有效提高推荐质量,缓解冷启动问题给推荐系统带来的困扰。近年来,由于计算复杂度上的优势,标签传播算法表现出了其在解决大规模网络的社团发现问题上的巨大潜力。受这一思想的启发,本文提出了一个新颖的标签传播算法来解决社会网络的社团划分问题。首先,我们认为网络中的每个节点具有大小不同的影响力,并给出计算节点影响力的公式。其次,我们采用分层传播的方式来进行标签传播,优先传播影响力大的节点所拥有的标签。这种处理方式综合了同步和异步更新策略的优势,使得算法能够更快地收敛,社团划分的结果也更加稳定。在几个数据集上的实验证明了该算法能够把社会网络合理地划分出非重叠和重叠社团,并且能够保证小社团的独立性,有效地解决了标签传播类算法社团划分不稳定的问题。和COPRA算法结果的对比,证明了我们提出的算法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景和目的
  • 1.2 研究现状
  • 1.2.1 社会网络的链接预测
  • 1.2.2 社会网络的社区挖掘
  • 1.3 本文的主要工作
  • 1.4 本文的组织
  • 第二章 链接预测和社团划分的常用方法
  • 2.1 社会网络分析
  • 2.2 链接预测
  • 2.2.1 基于邻居节点的方法
  • 2.2.2 基于路径距离的方法
  • 2.2.3 高阶方法
  • 2.3 社区挖掘
  • 2.3.1 网络的基本性质
  • 2.3.2 社团划分质量
  • 2.3.3 社团划分的常用策略
  • 2.4 本章小结
  • 第三章 基于信任关系的链接预测
  • 3.1 引言
  • 3.2 问题定义
  • 3.3 问题解决
  • 3.3.1 基本想法
  • 3.3.2 信任网络的聚类
  • 3.3.3 可信度计算
  • 3.3.4 评分相似度计算
  • 3.3.5 邻居用户权重计算
  • 3.3.6 产生预测
  • 3.3.7 TbCF算法框架
  • 3.4 实验
  • 3.4.1 数据集
  • 3.4.2 评价标准
  • 3.4.3 实验结果及分析
  • 3.5 小结
  • 第四章 分层标签传播的社团发现算法
  • 4.1 引言
  • 4.2 问题定义
  • 4.2.1 网络图模型
  • 4.2.2 节点影响力的量化
  • 4.2.3 标签传播度
  • 4.3 问题解决
  • 4.3.1 基本思路
  • 4.3.2 标签传播
  • 4.3.3 不显著标记的约减
  • 4.3.4 社团的调整
  • 4.3.5 中止条件
  • 4.4 实验
  • 4.4.1 数据集和评价方法
  • 4.4.2 标签更新策略的选择
  • 4.4.3 参数分析
  • 4.4.4 实验结果及分析
  • 4.5 小结
  • 总结与展望
  • 参考文献
  • 致谢
  • 个人简历、在读期间的研究成果及发表的学术论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    基于社会网络的链接预测和社区挖掘的研究
    下载Doc文档

    猜你喜欢