分布式环境下关联规则挖掘的隐私保护方法研究

分布式环境下关联规则挖掘的隐私保护方法研究

论文摘要

随着网络、通信和计算机技术的迅速发展,数据挖掘呈现出数据海量化,分布式挖掘等特点,如何在挖掘过程中保护隐私数据和防止敏感信息泄露已成为当前面临的重大挑战,隐私保护数据挖掘(PPDM)也已经成为数据挖掘(DM)领域的一个重要课题。关联规则挖掘是应用最为广泛的数据挖掘方法之一。本文对分布式环境下关联规则挖掘的隐私保护方法进行研究,目的就是在最大化地挖掘出数据库中潜藏的知识的同时保护数据隐私。本文从敏感数据的保护和敏感知识的保护两个方面,介绍了数据挖掘中常用的隐私保护技术;在概述了数据挖掘技术的基础上,重点介绍了分布式关联规则挖掘的原理和流行的算法,分析了各种算法的优缺点。在此基础上,本文针对分布式关联规则挖掘中敏感知识的保护进一步做了以下研究工作:(1)对于水平划分的数据集,设计了一种在本站点隐藏敏感规则的数据清洗算法。该算法在对本站点的数据集做最小改动的基础上,实现了对本站点数据集中敏感规则的完全隐藏,较大程度地保证了全局挖掘结果的准确性和对敏感规则的隐藏效果。此外,还采用RSA加密与同态加密相结合的加密方案对各个站点之间传送的频繁项集信息进行加密,该方案综合考虑了数据加密的安全性和加密算法的高效性,达到了效率与安全的平衡。(2)对于垂直划分的数据集,分布式关联规则挖掘的隐私保护的关键在于安全地计算全局频繁项集。本文提出一种新的安全求项集支持度的协议,该协议可以在准确地求出项集的支持度的同时不泄露各个站点的私有信息。(3)对文中设计的相关算法做了实验,实验结果表明这些算法具有较好的隐私保护性、准确性和高效性。论文在分布式环境下关联规则挖掘的隐私保护方面做了有益的工作。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 课题的研究背景与意义
  • 1.2 本文所做的工作
  • 1.3 本文内容的组织
  • 第二章 相关理论与技术概述
  • 2.1 数据挖掘
  • 2.1.1 数据挖掘的演化历史
  • 2.1.2 数据挖掘的基本概念
  • 2.1.3 数据挖掘的基本过程
  • 2.2 关联规则挖掘
  • 2.2.1 关联规则挖掘基本概念
  • 2.2.2 关联规则挖掘算法概述
  • 2.3 数据挖掘中的隐私保护
  • 2.3.1 隐私的定义与分类
  • 2.3.2 隐私保护与隐私的度量
  • 2.3.3 隐私保护技术的分类
  • 2.3.4 隐私保护的性能评估
  • 2.4 分布式关联规则挖掘及其安全问题概述
  • 2.4.1 问题的提出
  • 2.4.2 定理及性质的描述
  • 2.4.3 现有分布式关联规则挖掘算法概述
  • 2.4.4 现有分布式关联规则挖掘算法分析
  • 2.5 密码学及相关加密算法概述
  • 2.5.1 密码学概述
  • 2.5.2 公钥加密体制
  • 2.5.3 同态加密体制
  • 2.6 本章 小结
  • 第三章 水平分布下关联规则挖掘的隐私保护算法P-HDMA的设计
  • 3.1 问题的描述
  • 3.2 P-HDMA算法中隐藏规则的数据清洗策略与算法
  • 3.2.1 相关定义及分析
  • 3.2.2 清洗算法设计
  • 3.2.3 清洗算法的隐藏有效性证明
  • 3.3 P-HDMA算法安全性设计
  • 3.4 P-HDMA算法描述与性能分析
  • 3.4.1 算法描述
  • 3.4.2 性能分析
  • 3.5 实验和结果分析
  • 3.6 本章 小结
  • 第四章 垂直分布下关联规则挖掘的隐私保护算法P-VDMA的设计
  • 4.1 问题的描述
  • 4.2 相关技术分析
  • 4.2.1 安全两方点积协议
  • 4.2.2 可交换加密技术
  • 4.2.3 安全求交集大小协议
  • 4.3 P-VDMA算法描述与性能分析
  • 4.3.1 安全多方求项集支持度协议SMISCP的设计
  • 4.3.2 SMISCP协议的正确性和安全性分析
  • 4.3.3 P-VDMA算法描述
  • 4.3.4 算法性能分析
  • 4.4 实验和结果分析
  • 4.5 本章 小结
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 缩略词
  • 图表清单
  • 致谢
  • 参考文献
  • 攻读硕士学位期间的学术论文和科研情况
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  

    分布式环境下关联规则挖掘的隐私保护方法研究
    下载Doc文档

    猜你喜欢