基于社会化媒体的自适应信息推荐机制研究

基于社会化媒体的自适应信息推荐机制研究

论文摘要

由于互联网的优越特性,在其上发布信息极为便捷,这就使得互联网上的信息数量以近乎爆炸的速度增长。如此多的信息即使浏览一遍都无法做到,用户希望能找到感兴趣的部分更是不可能的。传统的搜索方法只能呈现给所有用户一样的排序结果,无法针对不同用户的兴趣偏好提供相应的服务。信息的爆炸使得信息的利用率反而降低,这种现象被称之为“信息过载”。推荐系统是为解决互联网上的信息过载问题而提出的一种智能代理系统,能从互联网的大量信息、中向用户自动推荐出符合其兴趣偏好或需求的资源。在当前Web 2.0的环境下,社会化媒体的出现使得用户不仅是网络内容的浏览者,也是网络内容的制造者。它的发展进一步加剧了网络时代的信息爆炸。传统的推荐系统通过让用户回答问题或者主动定制的方式来获取用户的兴趣,进而实现推荐。然而,用户的兴趣不是一成不变的,它会随着时间的推移而变化。针对该点,本文提出了一种自适应信息推荐机制,来及时跟踪用户兴趣变化,推荐用户感兴趣的资源。社会化媒体形式多样,如论坛、博客、内容社区、社交网络等。在这些形式下,用户可以发布或者转帖一篇文章,其他用户可以对其阅读或评论,这些评论本身又会被其他用户阅读或评论。从用户评论中,可以观察出用户当前感兴趣的话题。传统的基于内容的推荐方法一般根据原文的内容信息来推荐相关文章。然而,我们知道,随着用户讨论的继续,讨论的主题也会发生变化,即用户兴趣也会发生变化。这时,如果仅仅依据原文本体进行推荐,则返回的文章往往不是用户当前最感兴趣的,从而会降低用户的满意度。因此,本文考虑了结合用户评论和原文本体来构建主题模型,利用该模型来选择相关文章。根据观察发现,每条评论对推荐结果的影响应该是不一样的,如有些评论对原文内容有深刻的见解,而有些评论完全是无意义的讨论。所以,当利用用户评论信息来跟踪主题演变时,区分开每条评论的影响非常重要。这里,我们从用户评论中抽取出评论间语义关系、结构关系以及用户权威来区别每条评论对推荐的影响。分析事件报道在网络上的传播,可以发现其存在如下四个特点:转载重合、报道重合、包含重合和追踪重合。这些特点使得基于内容的推荐系统存在一个严重问题—重复推荐,即推荐文章的内容与原文含有相同的信息,这样会增加用户的阅读负担。于是,本文提出了一种方法来解释推荐文章与原文本体之间的逻辑关系(包括一般化、特殊化和重复),以此降低重复内容的推荐,推荐出符合用户需求的文章。本文第一部分介绍了课题的研究背景、研究目的和意义,对文中涉及到的一些基本概念作了简单介绍。介绍了推荐系统的定义;四种主要方法,即基于内容的推荐、协同过滤推荐、混合型推荐和基于数据挖掘技术的推荐;针对四种方法,分别以一个系统实例解释其工作模式;对推荐系统的评测标准进行了汇总。还介绍了社会化媒体的概念以及与传统媒体相比,其具有的一些特点。最后,总结了本文的主要工作和贡献如下:(1)本研究是在国内外率先结合用户评论来协助信息推荐服务的研究,为基于社会化媒体的信息推荐研究提供一条崭新的研究思路,将信息推荐的研究从Web 1.0的传统静态媒体延伸到了Web 2.0的社会化媒体模式。(2)为了充分利用社会化媒体的用户交互体验特征,我们独创性地设计了一套基于图论的用户评论信息挖掘机制,可以准确地捕捉用户对事件的关注焦点,并将其与原文本体内容相结合,使得推荐的结果既反映了作者的观点,也反映了读者的观点。(3)为了减轻用户的认知负担,我们创新性地提出了一套基于信息熵理论来判断文本逻辑关系的机制。通过该机制,我们可以获得推荐文章与原文章的逻辑关系。此外,该研究成果可以广泛地应用到文本分析的内容逻辑判断中。例如,搜索引擎的结果呈现,基于内容的广告设置等。本文第二部分介绍了该课题的研究基础与背景。首先,针对本文的实验对象,即新闻和博客,对已有的相关研究工作进行了总结。新闻推荐从现有的商业新闻推荐系统和学术研究两个方面进行了介绍。接着,针对文中存在的主题漂移问题,对主题检测与跟踪技术的研究发展进行了汇总。最后,对本文将涉及到的相关理论知识作了简要介绍,如语言模型,PageRank算法、信息熵、T检验等。本文第三部分是核心部分,介绍了自适应信息推荐机制的设计。首先,展示了总体系统框架图,并对其运作流程进行简单介绍。然后,针对框架中的各个模块进行详细阐述。通过用户间关系建模计算用户权威,这里的关系包括了引用关系与回复关系。在整个社区中,根据一个用户对另一个用户的信息进行引用或者回复来构建图模型,然后利用PageRank算法计算每个用户的权威。接着,计算评论权重。这里,我们同样利用了图模型,不同的是,现在的模型是建立在用户评论之间的关系上,这里的关系包括了语义、引用和回复关系。语义关系指的是两条评论之间的内容相似性,引用或回复关系指的是一条评论对另一条评论的信息引用或者回复。模型构建好后,也利用PageRank算法得出评论的权重。一条评论质量的好坏,由其作者的权威和评论本身共同决定,因此,我们将用户权威和评论权重结合起来,计算出每条评论的最终权重。其次,将这些权重信息和原文本体、用户评论一起输入到合成器中,构建主题模型。利用该主题模型从数据库中检索出相关文章。最后,根据信息熵理论来解释相关文章与原文本体之间的逻辑关系,返回符合用户兴趣的文章。本文第四部分是实验设计与分析。介绍了系统开发环境、实验数据的获取以及详细信息。实验数据包括两部分:一个是新闻数据集,一个是博客数据集。由于我们获取的是整个网页数据,所以需要对网页进行解析,抽取出所需部分。还介绍了评测标准的选取,为了评测目的,我们除了选用一些常用的指标,还引入了一个新的评测指标—新颖度,来度量返回文章的主题多样性。接着,设计了一系列实验:1)将本文提出的方法与两种常用方法进行比较,结果表明,在新闻和博客数据集上,我们的方法都明显优于其它两种;2)分析了用户权威和评论对推荐效果的影响,实验结果表明结合用户权威和评论信息有利于提高推荐效果;3)分析了评论间关系对推荐效果的影响,实验结果显示,针对不同的文本形式,有不同的推荐效果。对于新闻数据,结合用户评论间的内容关系会导致推荐效果的降低;然而,对于博客数据,结合用户评论间的内容关系有助于推荐效果的提高;4)对推荐关系解释进行了评估。本文的最后一部分是对本文研究工作的总结和未来研究工作的展望。总结了本文研究的基于社会化媒体的自适应信息推荐系统的整体设计;针对本文的研究工作,指出了其存在的一些不足之处,并给出了以后的发展方向。

论文目录

  • 摘要
  • Abstract
  • 1. 绪论
  • 1.1 研究背景
  • 1.2 研究目的及意义
  • 1.2.1 研究目的
  • 1.2.2 研究意义
  • 1.3 相关知识介绍
  • 1.3.1 推荐系统
  • 1.3.2 社会化媒体
  • 1.3.3 其他知识
  • 1.4 本文主要工作和贡献
  • 1.5 论文组织结构
  • 2. 研究基础与背景
  • 2.1 新闻与博客推荐
  • 2.1.1 新闻推荐
  • 2.1.2 博客推荐
  • 2.1.3 当前研究存在的问题
  • 2.2 主题检测与跟踪
  • 2.3 语言模型
  • 2.3.1 n-gram模型
  • 2.3.2 数据平滑技术
  • 2.4 向量空间模型
  • 2.5 信息熵
  • 2.6 图论
  • 2.7 PAGERANK
  • 2.8 T检验
  • 2.9 本章小结
  • 3. 信息推荐机制设计
  • 3.1 评论结合
  • 3.1.1 用户权威得分
  • 3.1.2 评论得分
  • 3.2 主题模型构建
  • 3.3 推荐关系的解释
  • 3.4 本章小结
  • 4. 实验设计与分析
  • 4.1 开发环境
  • 4.2 实验数据
  • 4.3 评测标准
  • 4.4 总体效果比较
  • 4.5 参数的设置
  • 4.6 用户权威与评论的影响分析
  • 4.7 评论间关系的影响分析
  • 4.8 推荐关系解释
  • 4.9 本章小结
  • 5. 总结与展望
  • 5.1 研究工作总结
  • 5.2 未来的研究内容展望
  • 参考文献
  • 后记
  • 致谢
  • 攻读学位期间的科研成果目录
  • 相关论文文献

    • [1].基于分类算法的农产品电商推荐系统的设计与实现[J]. 农家参谋 2020(15)
    • [2].基于人性化特征的旅游地智能推荐系统[J]. 现代电子技术 2020(11)
    • [3].面向财经资讯的混合推荐系统研究与实践[J]. 现代电视技术 2020(04)
    • [4].基于知识图谱的商品推荐系统[J]. 信息通信 2020(06)
    • [5].推荐系统的商业价值[J]. 软件和集成电路 2019(04)
    • [6].大数据背景下新闻推荐系统中的问题以及解决对策[J]. 科技传播 2019(13)
    • [7].国内旅游推荐系统研究进展[J]. 商场现代化 2017(10)
    • [8].旅游推荐系统研究综述[J]. 计算机科学 2017(10)
    • [9].网络推荐系统的三大挑战——从用户体验出发[J]. 清华管理评论 2013(06)
    • [10].基于大数据下电子商务商品推荐系统的分析[J]. 环球市场信息导报 2017(27)
    • [11].共享经济中智能推荐系统的应用与分析[J]. 石河子科技 2020(06)
    • [12].食用菌电子商务订单智能推荐系统[J]. 中国食用菌 2020(04)
    • [13].知识图谱在图书馆推荐系统中的应用研究[J]. 自动化应用 2020(08)
    • [14].美团推荐系统实证系统[J]. 农家参谋 2018(11)
    • [15].大数据时代的人才推荐系统[J]. 大数据 2017(02)
    • [16].基于链路预测的个性化网络推荐系统研究[J]. 福建电脑 2017(07)
    • [17].网络信息推荐系统存在的问题及发展方向[J]. 科技创新导报 2016(02)
    • [18].推荐系统用户感知调研[J]. 工业设计研究 2018(00)
    • [19].电商推荐系统进阶[J]. IT经理世界 2013(11)
    • [20].无线网络的电子商务商品自动推荐系统[J]. 现代电子技术 2020(07)
    • [21].基于注意力模型的混合推荐系统[J]. 计算机工程与应用 2020(13)
    • [22].基于大数据下的智能推荐系统设计[J]. 电脑编程技巧与维护 2020(07)
    • [23].大数据与推荐系统研究[J]. 电脑知识与技术 2018(34)
    • [24].推荐系统领域研究现状分析[J]. 情报探索 2019(01)
    • [25].“随游而安”智能推荐系统的研究[J]. 科技传播 2017(14)
    • [26].推荐系统体验模型探索——以视频推荐为例[J]. 工业设计研究 2018(00)
    • [27].高校图书馆主动式个性化书籍推荐系统设计[J]. 长江大学学报(自科版) 2013(34)
    • [28].基于本体的个性化信息推荐系统研究[J]. 电子世界 2014(04)
    • [29].近十年国外旅游推荐系统的应用研究[J]. 旅游学刊 2014(08)
    • [30].移动推荐系统及其应用[J]. 软件学报 2013(01)

    标签:;  ;  ;  ;  ;  ;  

    基于社会化媒体的自适应信息推荐机制研究
    下载Doc文档

    猜你喜欢