基于可用性的数据匿名化研究

基于可用性的数据匿名化研究

论文摘要

在各式各样的数据应用中,隐私保护越来越受到人们的关注。这个现象主要有两个方面的原因:一方面,随着数据库技术和互联网的不断发展,越来越多的数据可以被人们发布和使用,这些涉及到社会生活的方方面面的数据可能包含了个人的隐私信息,例如医院的病历数据就包含了特定的个人患有某种疾病的信息;另一方面,人们越来越懂得数据的价值,期望获得和使用更多的数据来实现特定的应用,例如从病历数据中挖掘关联规则。于是,如何在数据的发布和使用中保护个人隐私成为了一个越来越严峻的话题。数据匿名化是实现隐私保护的一个有效手段,其基本思想是通过改变(概化或者隐藏)原始数据中的部分数据,使改变后的数据无法和其他信息相结合,推理出关于任何个人的隐私信息。如何对含有隐私信息的数据进行匿名化已经吸引了大量的研究工作。然而,大多数已有的工作并没有考虑数据在匿名化后的使用目的,这导致匿名化后数据的可使用性不尽理想。因此如何在保护隐私的同时获得良好的数据可用性,这是学术界和工业界都亟需解决的一个问题。本文主要研究基于可用性的数据匿名化问题,一个在数据隐私保护领域中的全新问题。本文的研究成果主要有:1.提出了基于可用性的数据匿名化思想:将数据匿名化方法与数据的使用目的相联系,强调匿名化后数据的可用性。为此本文提出了一种新型的匿名化质量度量,并形式化地定义了基于可用性的匿名化问题。2.证明了基于可用性的匿名化问题在通常意义上是一个NP难问题,给出了两个启发式的基于可用性的匿名化算法。大量的在真实数据和人工数据上的实验评估证明,这两个算法在匿名化效果上具有良好的性能,相比已有的研究成果,这两个基于可用性的匿名化算法在匿名化后数据的可用性方面,具有明显的优势。3.分析了在数据有增量更新时潜在的隐私威胁,提出了一种基于可用性的并且可以确保隐私安全的增量匿名化策略,并给出相应的算法。该算法可以在保证隐私安全的前提下,优化数据的可用性。此外,由于该算法是一个增量式的算法,在效率上也体现了良好的性能。4.探讨了数据匿名化问题的实质,并通过将基于可用性的匿名化方法扩展到能够适应其他数据匿名化原则,来深入阐述基于可用性的匿名化的意义。

论文目录

  • 摘要
  • Abstract
  • 1 引言
  • 1.1 数据匿名化问题介绍
  • 1.2 基于可用性的数据匿名化
  • 1.3 本文的组织
  • 2 数据匿名化相关工作
  • 2.1 相关模型
  • 2.2 复杂性
  • 2.3 相关算法
  • 3 基于可用性的匿名化
  • 3.1 问题分析和动机
  • 3.2 可用性度量模型
  • 3.3 基于可用性的匿名化问题
  • 3.4 基于可用性的匿名化算法
  • 3.5 性能分析与评估
  • 3.6 小结
  • 4 增量更新问题
  • 4.1 问题分析和动机
  • 4.2 隐私威胁剖析
  • 4.3 安全的增量匿名化算法
  • 4.4 性能分析与评估
  • 4.5 小结
  • 5 深入探讨
  • 5.1 问题实质再分析
  • 5.2 扩展到其他匿名化原则
  • 6 总结
  • 6.1 本文总结
  • 6.2 未来工作
  • 参考文献
  • 攻读硕士学位期间发表的论文
  • 致谢
  • 相关论文文献

    • [1].大数据时代数据主权与隐私保护面临的安全挑战[J]. 管理现代化 2019(01)
    • [2].隐私计算—面向隐私保护的新型计算[J]. 信息通信技术 2018(06)
    • [3].大数据的安全与隐私保护研究[J]. 河南科技 2018(35)
    • [4].电商个性化背景下企业间隐私保护的主从博弈分析[J]. 经济与管理 2019(02)
    • [5].车载自组织网络的隐私保护综述[J]. 信息网络安全 2019(04)
    • [6].大数据背景下图书馆读者隐私保护探讨研究[J]. 中国科技产业 2019(04)
    • [7].美英澳政府数据开放隐私保护政策法规的考察与借鉴[J]. 情报理论与实践 2019(06)
    • [8].医疗大数据的隐私伦理问题研究[J]. 锦州医科大学学报(社会科学版) 2019(03)
    • [9].高校大数据应用中的安全及隐私保护研究[J]. 网络安全技术与应用 2019(09)
    • [10].美国《儿童在线隐私保护法》的适用与商业合规[J]. 中国信息安全 2019(10)
    • [11].大数据时代之下的个人隐私保护[J]. 数字通信世界 2019(11)
    • [12].浅谈青海省大数据的安全与隐私保护[J]. 通讯世界 2017(24)
    • [13].数据自治开放模式下的隐私保护[J]. 大数据 2018(02)
    • [14].大数据行业发展现状及个人隐私保护对策研究[J]. 计算机产品与流通 2018(08)
    • [15].移动医疗中基于机会计算的安全和隐私保护模型[J]. 小型微型计算机系统 2016(12)
    • [16].大数据信息通信技术对个人隐私保护的影响分析[J]. 通讯世界 2017(07)
    • [17].一种基于隐私偏好的二次匿名位置隐私保护方法[J]. 山东大学学报(理学版) 2017(05)
    • [18].中日图书馆读者自我隐私保护意识比较研究[J]. 河北科技图苑 2017(04)
    • [19]."2017(第二届)中国隐私保护学术会议暨2017中国保密技术交流大会隐私保护论坛"在贵阳举行[J]. 信息网络安全 2017(09)
    • [20].大数据及其隐私保护[J]. 大数据 2017(05)
    • [21].大数据时代新西兰个人隐私保护进展及对我国的启示[J]. 电子政务 2017(11)
    • [22].一种增强的个性化匿名隐私保护模型改进[J]. 现代电子技术 2017(22)
    • [23].差分隐私保护参数ε的选取研究[J]. 通信学报 2015(12)
    • [24].浅谈大数据背景下个人隐私保护的可能性[J]. 商 2016(04)
    • [25].欧盟隐私监管机构要求修改欧美新的隐私保护协定[J]. 信息安全与通信保密 2016(05)
    • [26].基于安全多方求和与可验证私密分享的位置隐私保护协议[J]. 南京理工大学学报 2016(03)
    • [27].大数据时代下的个人隐私保护[J]. 商 2016(22)
    • [28].数据共享时代的个人隐私保护[J]. 学术交流 2016(09)
    • [29].大数据隐私保护技术的应用[J]. 电子技术与软件工程 2016(18)
    • [30].急诊病人隐私保护策略的实施及效果评价[J]. 护理研究 2015(07)

    标签:;  ;  ;  ;  

    基于可用性的数据匿名化研究
    下载Doc文档

    猜你喜欢