基于微博的突发事件检测和信息传播建模

基于微博的突发事件检测和信息传播建模

论文摘要

微博客自问世以来,以其实时性和便捷性受到用户的钟爱,成为网络应用中炙手可热的新宠,微博上聚集的大量用户及相对自由的言论信息又使得微博成为把握社会脉搏的有力工具。所以本文的研究基于微博平台,致力于发掘微博平台中的突发事件并在此基础上进行微博网络中信息传播方式的建模。本文的工作主要分为以下几个方面:首先,获取基于微博研究的数据集。进行“人民微博”上的信息抽取工作,应用针对该微博平台页面信息结构设计的爬虫,对该平台的整体信息和热点信息分别进行抽取并存储,整体信息一次性抽取,内容包括微博信息,用户信息和用户关系信息等;热点信息实时抽取,内容包括热点微博信息,热点用户信息和热点关键词信息。而后,检测微博中的突发事件。微博的简短性使得其对事件的描述中,事件的主题词以很高比例出现,并呈现与事件一致的受关注程度,所以本文突发事件的检测部分以事件主题词的检测为线索。首先选择微博语料适用的特征值和数据组织方法;而后构建时间窗内各词的特征轨迹,结合特征轨迹的时域和频域特征判定词的突发性,由于突发事件的主题词包括其人物、地点信息,这些词通常是未登录词但对事件的表达意义重大,所以在该过程进行新词发现;最后根据各突发词的在微博中的共现情况进行聚类,实现突发词与突发事件的对应,并利用已有微博信息提供突发事件的详细描述。最后,构建微博用户网络的信息传播模型。在突发事件信息的基础上,结合微博中信息传播的途径和特点,构建了微博中信息传播的五元组模型,分析了模型各元素的影响因素和元素的表征方法,并在此基础上实现了微博网络中信息传播过程的模拟。这部分着重对微博网络中节点的信息传播能力进行分析,舆情监督过程通过控制信息传播能力强的节点可以有效控制信息的传播。本文的突发事件检测工作能够较真实、及时的映射社会上的重大事件,对民众了解时事,有关部门提前预警都有一定的帮助;信息传播建模工作可以预测信息传播的过程及关键节点,为信息传播监督和控制工作提供参考。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 课题研究的背景和意义
  • 1.2 国内外研究现状
  • 1.2.1 微博的性质及应用
  • 1.2.2 突发事件的检测
  • 1.2.3 信息传播建模
  • 1.3 本文的主要研究内容
  • 第2章 微博信息抽取
  • 2.1 信息源的选择与微博中信息的定义
  • 2.1.1 微博信息源的选择
  • 2.1.2 微博中的信息定义
  • 2.2 模拟登陆和格式化网页信息抽取
  • 2.2.1 模拟登陆
  • 2.2.2 格式化网页信息抽取
  • 2.3 微博信息抽取及存储
  • 2.3.1 热点信息抽取
  • 2.3.2 整体信息抽取
  • 2.3.3 数据存储设计
  • 2.4 本章小结
  • 第3章 微博中的突发事件检测
  • 3.1 词特征轨迹构造
  • 3.1.1 词特征轨迹的构造算法
  • 3.1.2 时间单元及词特征值的选择分析
  • 3.1.3 新词发现方法
  • 3.2 突发事件的检测
  • 3.2.1 突发词的检测及突发区间的定位
  • 3.2.2 突发事件的构成
  • 3.3 实验及结果分析
  • 3.4 本章小结
  • 第4章 微博中的信息传播建模
  • 4.1 节点的信息传播能力建模
  • 4.1.1 节点的信息传播能力的影响因素
  • 4.1.2 节点的信息传播能力度量值估计
  • 4.2 信息传播模型的构建及传播过程的模拟
  • 4.2.1 信息传播模型的构建
  • 4.2.2 信息传播过程的模拟
  • 4.3 实验及结果分析
  • 4.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文及其它成果
  • 致谢
  • 相关论文文献

    • [1].快速平滑点特征轨迹电子稳像[J]. 红外与激光工程 2014(06)
    • [2].基于优选特征轨迹的全分辨率视频稳定[J]. 电子与信息学报 2015(05)
    • [3].一种抗信息丢失的稳像系统[J]. 光电子.激光 2013(07)
    • [4].二维空间重构电流特征轨迹的变压器差动保护判据[J]. 电力系统自动化 2020(09)
    • [5].工业机器人的仿人智能控制[J]. 重庆理工大学学报(自然科学) 2012(07)
    • [6].基于突发特征分析的事件检测[J]. 计算机应用研究 2011(01)
    • [7].移动点与参考地物时空关系的自然语言描述方法研究[J]. 地理与地理信息科学 2015(03)
    • [8].空中运动目标的特征航迹描述及仿真[J]. 通信技术 2010(05)
    • [9].基于随机投影和Fisher向量的人的行为识别[J]. 高技术通讯 2015(Z1)

    标签:;  ;  ;  ;  

    基于微博的突发事件检测和信息传播建模
    下载Doc文档

    猜你喜欢