隐私保护的微聚集算法研究

隐私保护的微聚集算法研究

论文摘要

在现代信息社会中,网络的快速发展使得越来越多的数据实现了共享,其中很多数据含有用户的隐私信息。信息的增长为人们的工作和生活提供了便利,也对个人隐私造成了威胁。在数据发布的过程中,常常会出现用户隐私信息泄露的问题,隐私保护已成为一个重要的研究领域。k-匿名是保护隐私信息的重要方法,它能够简单有效地对发布数据进行隐私保护。近几年,很多学者又将微聚集方法与k-匿名技术相结合,以达到更好的匿名效果。本文主要针对隐私保护中的微聚集方法进行研究,具体工作如下:(1)研究了隐私保护的相关技术,重点分析了k-匿名模型和l-多样性模型,通过对各种k-匿名算法的比较,明确了各算法的优缺点,并对算法的不足之处提出了改进。(2)对隐私保护中的微聚集方法进行了深入研究,总结了微聚集匿名技术的发展动态,分析了微聚集算法的评估模型。针对现有微聚集算法在处理大样本数据集时耗时长、效率低的问题,提出了改进方法。通过引入分治法思想,对大数据集进行聚类预处理,能够缩短算法执行时间,提高算法运行效率。(3)分析了初始聚类对数据集敏感属性分布的影响,针对现有微聚集算法在处理敏感属性多样性问题时的不足,本文在聚类基础上提出了一种MKL算法。该算法在初始聚类的过程中按比例划分,然后再对各个子数据集进行l-多样性处理,从而使得匿名数据既能满足可用性,又不会造成过高的信息损失。最后对算法中m值的取定给出了有效评估方法。(4)利用加利福尼亚大学机器学习中心的Adult数据库对算法进行了相关实验,并对实验结果进行了分析。通过比较算法的执行时间、信息损失度及隐私泄露风险,对算法性能作了评估。实验结果表明, MKL算法不仅能够提高运行效率,而且在聚类中实现了l-多样性,使数据的安全性得到了提高。

论文目录

  • 中文摘要
  • 英文摘要
  • 1 绪论
  • 1.1 研究背景及意义
  • 1.1.1 隐私保护概述
  • 1.1.2 隐私保护的重要性
  • 1.2 研究现状
  • 1.3 研究内容
  • 1.4 论文组织结构
  • 2 隐私保护相关技术
  • 2.1 隐私泄露
  • 2.2 传统隐私保护技术
  • 2.3 数据发布隐私保护技术
  • 2.3.1 随机过程扰动技术
  • 2.3.2 匿名隐私保护技术
  • 2.4 K-匿名技术
  • 2.4.1 基本概念
  • 2.4.2 k-匿名介绍
  • 2.4.3 l-多样性模型
  • 2.4.4 k-匿名扩展研究
  • 2.4.5 k-匿名实现方法
  • 2.5 K-匿名评估标准
  • 2.5.1 信息损失评估标准
  • 2.5.2 泄露风险评估标准
  • 2.6 本章小结
  • 3 K-匿名算法研究与改进
  • 3.1 基于泛化和隐匿的算法
  • 3.1.1 全域泛化算法
  • 3.1.2 局域泛化算法
  • 3.2 聚类算法
  • 3.3 微聚集算法
  • 3.4 本章小结
  • 4 基于二次聚类的 MKL 算法
  • 4.1 微聚集算法不足
  • 4.2 算法改进
  • 4.3 MKL 算法描述
  • 4.4 时间分析
  • 4.5 算法度量标准
  • 4.6 本章小结
  • 5 实验结果与分析
  • 5.1 实验环境与数据结构
  • 5.2 实验分析
  • 5.2.1 时间对比
  • 5.2.2 信息损失对比
  • 5.2.3 泄露风险对比
  • 5.2.4 M 值分析
  • 5.3 本章小结
  • 6 总结及展望
  • 6.1 工作总结
  • 6.2 未来研究展望
  • 致谢
  • 参考文献
  • 附录
  • A 作者在攻读学位期间发表的论文目录
  • 相关论文文献

    • [1].大数据时代个人隐私保护探讨[J]. 科技传播 2020(01)
    • [2].基于利益最大化的位置隐私保护技术研究[J]. 智能计算机与应用 2020(01)
    • [3].数字经济中的隐私保护与支配地位滥用[J]. 中国社会科学院研究生院学报 2020(01)
    • [4].基于隐私保护的政府大数据治理研究[J]. 大数据 2020(02)
    • [5].大数据背景下个人隐私保护研究[J]. 信息与电脑(理论版) 2020(03)
    • [6].基于区间区域的位置隐私保护方法[J]. 计算机工程与应用 2020(08)
    • [7].新闻聚合平台的算法规制与隐私保护[J]. 现代传播(中国传媒大学学报) 2020(04)
    • [8].浅析大数据行业发展现状及个人隐私保护[J]. 计算机产品与流通 2020(04)
    • [9].大数据背景下隐私保护屏障的分析与研究[J]. 法制与社会 2020(08)
    • [10].大数据时代大学生网络环境隐私保护行为调查分析[J]. 黑龙江教育(理论与实践) 2020(05)
    • [11].持续监控下差分隐私保护[J]. 软件学报 2020(06)
    • [12].满足差分隐私保护的数据分析方法的设计与实现[J]. 电视技术 2019(22)
    • [13].联邦学习安全与隐私保护研究综述[J]. 西华大学学报(自然科学版) 2020(04)
    • [14].大数据下信息通信技术中的隐私保护[J]. 信息与电脑(理论版) 2020(12)
    • [15].面向各类攻击的差分隐私保护模型[J]. 网络安全技术与应用 2020(08)
    • [16].面向共谋攻击的位置隐私保护方案[J]. 佳木斯大学学报(自然科学版) 2020(04)
    • [17].旅游大数据商业化应用中的游客隐私保护研究[J]. 福建电脑 2020(08)
    • [18].“互联网+”时代高校学生隐私保护研究[J]. 科技创新与生产力 2020(09)
    • [19].一种新的多用户位置隐私保护方案[J]. 工程科学与技术 2020(05)
    • [20].大数据时代个人隐私保护的路径重构[J]. 现代企业 2020(10)
    • [21].大数据时代数据主权与隐私保护面临的安全挑战[J]. 管理现代化 2019(01)
    • [22].隐私计算—面向隐私保护的新型计算[J]. 信息通信技术 2018(06)
    • [23].大数据的安全与隐私保护研究[J]. 河南科技 2018(35)
    • [24].电商个性化背景下企业间隐私保护的主从博弈分析[J]. 经济与管理 2019(02)
    • [25].车载自组织网络的隐私保护综述[J]. 信息网络安全 2019(04)
    • [26].大数据背景下图书馆读者隐私保护探讨研究[J]. 中国科技产业 2019(04)
    • [27].美英澳政府数据开放隐私保护政策法规的考察与借鉴[J]. 情报理论与实践 2019(06)
    • [28].医疗大数据的隐私伦理问题研究[J]. 锦州医科大学学报(社会科学版) 2019(03)
    • [29].高校大数据应用中的安全及隐私保护研究[J]. 网络安全技术与应用 2019(09)
    • [30].美国《儿童在线隐私保护法》的适用与商业合规[J]. 中国信息安全 2019(10)

    标签:;  ;  ;  ;  

    隐私保护的微聚集算法研究
    下载Doc文档

    猜你喜欢