当前位置: 首页 > 专利查询>中国人民解放军战略支援部队航天工程大学专利>正文

一种关联大数据的隐私保护方法及系统技术方案

技术编号：19693279 阅读：60 留言：0更新日期：2018-12-08 11:32

本发明专利技术公开了一种大数据的隐私保护方法，包括：通过机器学习构建k‑means聚类算法的k相关记录差分隐私保护模型；通过隐私机制和查询函数构建线性回归r‑相关块差分隐私保护模型；根据r‑相关块差分隐私保护模型将大数据划分为独立数据块；根据查询函数计算独立数据块的敏感度，根据k‑相关记录差分隐私保护模型对独立数据块进行差分隐私保护。本发明专利技术还公开了一种大数据隐私保护方法的系统，包括：k相关记录差分隐私保护模型构建模块；r‑相关块差分隐私保护模型构建模块；独立数据块划分模块；独立数据块差分隐私保护模块，用于根据查询函数计算独立数据块的敏感度，根据k‑相关记录差分隐私保护模型对独立数据块进行差分隐私保护。

全部详细技术资料下载

【技术实现步骤摘要】
一种关联大数据的隐私保护方法及系统
本专利技术涉及大数据
，特别是指一种关联大数据的隐私保护方法及系统。
技术介绍
大数据是信息技术发展的又一里程碑，被称为科学研究的“第四范式”，具备科学的理论基础和先进的技术手段，从提出之日起就引领时代发展。经过几年的快速发展，大数据被广泛应用在科技、金融、交通、教育、医疗卫生等各个领域，为推动经济发展和服务人类社会发挥了巨大作用创造了巨大价值。随着大数据技术的发展和广泛应用，数据采集和数据挖掘已成为普遍现象，一方面，通过挖掘隐藏在数据背后的潜在价值有利于促进社会发展，另一方面，过度的数据挖掘和缺乏有效的数据保护，也导致了数据拥有者大量隐私或敏感数据泄露的问题。如何在不影响大数据分析研究、共享使用的前提下，使得数据和隐私安全能够得到有效保护，成为目前亟待研究和解决的热点问题。差分隐私保护具有完备的数学理论基础，能够提供强健的隐私保护，被认为是目前最先进的隐私保护技术。但是在实际应用中，特别是在大数据应用场景中，大量数据之间往往存在着较强的耦合性或相关性，称这些数据为相关数据。现有的差分隐私保护方法在数据集上会使攻击者得到更多的背景知识，增加了隐私泄露的风险。因此，如何利用差分隐私方法解决相关数据的隐私保护问题，对研究和解决关联大数据隐私安全问题具有重要的现实意义。
技术实现思路
有鉴于此，本专利技术的目的在于提出一种关联大数据的隐私保护方法及系统,以更好地保护大数据的隐私安全。基于上述目的本专利技术提供的一种关联大数据的隐私保护方法，包括：通过机器学习和最大信息系数构建关联大数据的因果关系模型；通过k-相邻数据集构建k...

【技术保护点】
1.一种关联大数据的隐私保护方法，其特征在于，包括：通过机器学习和最大信息系数构建关联大数据的因果关系模型；通过k‑相邻数据集构建k‑相关记录差分隐私保护模型；提供相关敏感度概念，通过所述因果关系模型计算所述k‑相邻数据集的相关敏感度，再利用means‑Laplace机制实现k‑相关记录差分隐私保护；利用最大信息系数‑K‑Means算法将所述关联大数据进行r‑块划分，得到多个相互独立的数据子块；根据查询函数计算所述数据子块的相关敏感度，对每个数据子块进行所述k‑相关记录差分隐私保护；根据差分隐私组合性质，对所述关联大数据集进行r‑相关块差分隐私的保护。

【技术特征摘要】
1.一种关联大数据的隐私保护方法，其特征在于，包括：通过机器学习和最大信息系数构建关联大数据的因果关系模型；通过k-相邻数据集构建k-相关记录差分隐私保护模型；提供相关敏感度概念，通过所述因果关系模型计算所述k-相邻数据集的相关敏感度，再利用means-Laplace机制实现k-相关记录差分隐私保护；利用最大信息系数-K-Means算法将所述关联大数据进行r-块划分，得到多个相互独立的数据子块；根据查询函数计算所述数据子块的相关敏感度，对每个数据子块进行所述k-相关记录差分隐私保护；根据差分隐私组合性质，对所述关联大数据集进行r-相关块差分隐私的保护。2.根据权利要求1所述的关联大数据的隐私保护方法，其特征在于，所述k-相关记录差分隐私保护模型包括：其中，D1为大数据集，D2为大数据集D1中k条记录发生改变所生成，1≤k≤l，l为大数据集D1中的记录条数，为隐私机制，f为查询函数，Pr为概率分布，为实数集，∈为隐私预算。3.根据权利要求2所述的关联大数据的隐私保护方法，其特征在于，所述隐私机制满足f为查询函数，e为随机噪声，‖·‖1为1范数。4.根据权利要求2所述的关联大数据的隐私保护方法，其特征在于，D1和D2为关联大数据集，满足|D1ΔD2|＝k，且1≤k≤l，大数据集D1中具有n个数据，l条相关记录，D2为大数据集D1中k条记录发生改变所生成。5.根据权利要求1所述的关联大数据的隐私保护方法，其特征在于，所述因果关系模型为经过回归分析后构建的神经网络模型。6.根据权利要求1所述的关联大数据的隐私保护方法，其特征在于，所述r-相关块差分隐私保护包括：为待发布数据集B的隐私机制，Pr为概率分布，f为查询函数，Bj和B-j为邻接数据集，为实数集...

【专利技术属性】
技术研发人员：朱诗兵，吕登龙，李长青，刘冉，
申请(专利权)人：中国人民解放军战略支援部队航天工程大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人