面向SNS的社会网络数据抓取与经验性分析

面向SNS的社会网络数据抓取与经验性分析

论文摘要

随着万维网的迅速发展,蕴含的社会网络数据迅速膨胀,其结构异常复杂,人们很难通过数字、表格或文字的方式对没有进行处理的海量数据进行分析、表示和管理,社会网络所包含的丰富信息资源难以被发现和有效利用。本论文对照片共享网站Flickr进行结构考察、抓取社会网络用户关系数据集,并对抓取的社会网络数据集进行出入度分析,在SQL Server 2005数据库管理平台上,通过SQL编程对社会网络数据集进行了压缩,再以给定用户作为中心节点提取周边的局部社会网络,并根据局部社会网络中用户节点度数选取关键的网络节点,通过查找最短路径将中心节点与关键节点连接起来,最终得到了三个矩阵形式表示的关键社会网络,设计了按照“同心圆”的模式围绕中心节点对关键社会网络进行了初始布点的相关算法,并基于Matlab平台设计和实现了布点算法,对提取的关键网络结构进行了可视化展示。通过对社会网络数据集的研究,本文得出社交网络Flickr具有复杂网络的无标度特征,并提出了基于SQL编程的社会网络数据集压缩方案,此方案提高了社会网络数据集压缩的效率。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 研究内容、方法、手段及论文组织结构
  • 1.3.1 研究内容
  • 1.3.2 研究方法及手段
  • 1.3.3 论文的组织结构
  • 1.4 预期成果
  • 第二章 社会网络数据抓取、压缩与可视化
  • 2.1 数据抓取技术
  • 2.2 数据压缩技术
  • 2.2.1 压缩与可视化的关系
  • 2.2.2 压缩算法的概述
  • 2.3 可视化作图技术
  • 2.3.1 作图算法的要求
  • 2.3.2 作图算法的思想
  • 2.4 小结
  • 第三章 Flickr网站数据的抓取及度数分析
  • 3.1 Flickr网站
  • 3.1.1 网站简介
  • 3.1.2 网站总体结构
  • 3.2 数据抓取开发环境及整体思路
  • 3.3 程序架构设计
  • 3.3.1 基于MFC的程序架构设计
  • 3.3.2 具体实现
  • 3.4 Flickr网用户度数分析
  • 3.4.1 社会网络用户度数
  • 3.4.2 无标度网络及数据集
  • 3.4.3 Flickr用户出入度数分析
  • 3.5 小结
  • 第四章 社会网络数据集压缩及关键网络的生成
  • 4.1 社会网络数据集压缩和关键网络生成思路及方案
  • 4.1.1 总体压缩和关键网络生成的思路
  • 4.1.2 总体压缩和关键网络生成的方案
  • 4.2 提取给定用户周边局部网络
  • 4.2.1 关键表设计
  • 4.2.2 提取周边好友节点
  • 4.2.3 提取好友的出入度
  • 4.2.4 结果数据分析
  • 4.3 选取关键节点
  • 4.4 关键网络的生成
  • 4.4.1 最短路径算法的概述
  • 4.4.2 最短路径算法的实现
  • 4.4.3 关键网络节点的关系矩阵
  • 4.4.4 关系矩阵的结果展示
  • 4.5 小结
  • 第五章 社会网络数据可视化
  • 5.1 总体思路
  • 5.2 初始布点
  • 5.3 社会网络可视化布点算法
  • 5.3.1 社会网络可视化布点算法思路
  • 5.3.2 社会网络可视化布点算法伪代码
  • 5.4 二维Matlab实现及结果
  • 5.4.1 二维Matlab实现的核心代码
  • 5.4.2 二维结果图展示
  • 5.5 基于Matlab的辅助点展示
  • 5.5.1 扩展研究的意义及算法概述
  • 5.5.2 MATLAB实现示例及结果
  • 5.6 小结
  • 结论与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].六个全球历史土地覆盖数据集数据来源的对比分析[J]. 北京师范大学学报(自然科学版) 2019(06)
    • [2].基于多数据集动态潜变量的在线性能分级评估方法[J]. 控制理论与应用 2020(03)
    • [3].代表性人口空间分布数据集的精度评价——以2010年广东省为例[J]. 热带地理 2020(02)
    • [4].高速公路场景下基于深度学习的数据集建立[J]. 数字技术与应用 2020(02)
    • [5].构建图形图像数据集的方法概述[J]. 计算机产品与流通 2020(08)
    • [6].多国议会数据集及平台建设研究[J]. 情报工程 2020(02)
    • [7].国际主要科学数据集检索平台对比研究[J]. 情报工程 2020(01)
    • [8].实验室化学品纯化方法数据集[J]. 中国科学数据(中英文网络版) 2020(02)
    • [9].化学药物数据集[J]. 中国科学数据(中英文网络版) 2019(01)
    • [10].中亚地区陆表物候逐年数据集(1982–2015)[J]. 全球变化数据学报(中英文) 2020(01)
    • [11].南京百年人物数据集[J]. 中国科学数据(中英文网络版) 2020(03)
    • [12].替代计量学视角下科学数据集价值的定量测度研究[J]. 情报理论与实践 2020(09)
    • [13].数据集采器在临床护理工作中的应用价值探讨[J]. 基层医学论坛 2017(12)
    • [14].医院感染监测基本数据集的建立及作用[J]. 中华医院感染学杂志 2016(11)
    • [15].TextGen:用于新型存储系统基准测试的真实文本数据集生成方法(英文)[J]. Frontiers of Information Technology & Electronic Engineering 2016(10)
    • [16].卫星气候数据集的应用研究与发展分析[J]. 地球信息科学学报 2015(11)
    • [17].用于生命之树重建的数据集[J]. 中国科学数据(中英文网络版) 2017(03)
    • [18].中国有毒动物数据集[J]. 中国科学数据(中英文网络版) 2017(04)
    • [19].基于次序依赖的电力数据集修复[J]. 电测与仪表 2019(24)
    • [20].粤港澳湾区1:50000斗门镇幅工程地质调查及岩土样品试验数据集[J]. 中国地质 2019(S2)
    • [21].全集水网数据集更新方法研究[J]. 经纬天地 2020(01)
    • [22].智能城市产业资讯汇总[J]. 智能城市 2020(11)
    • [23].基于神经网络的机器阅读理解综述[J]. 软件学报 2020(07)
    • [24].2002–2010年中国典型生态系统辐射及光能利用效率数据集[J]. 中国科学数据(中英文网络版) 2019(01)
    • [25].基于镶嵌数据集的海量数据存储管理——以青海湖流域为例[J]. 地球环境学报 2013(04)
    • [26].基于数据集相似性的分类算法推荐[J]. 计算机应用与软件 2016(08)
    • [27].数字数据集揭示文化遗产促进城市可持续发展[J]. 世界遗产 2016(05)
    • [28].洞庭湖区堤垸1949—2013空间分布数据集[J]. 全球变化数据学报(中英文) 2017(01)
    • [29].云南省标准化降水蒸散指数数据集(1998-2012)[J]. 全球变化数据学报(中英文) 2017(04)
    • [30].1979~1998年工业腐蚀失效分析数据集[J]. 中国科学数据(中英文网络版) 2017(01)

    标签:;  ;  ;  ;  

    面向SNS的社会网络数据抓取与经验性分析
    下载Doc文档

    猜你喜欢