一种相关数据差分隐私保护性能的标准化测试方法及装置制造方法及图纸

技术编号：21246772 阅读：26 留言：0更新日期：2019-06-01 07:13

本发明专利技术公开了一种相关数据差分隐私保护性能的标准化测试方法及装置，该方法通过设定特定长度的观测窗口，将待测试的加扰数据分段，然后计算加扰数据段的自相关函数和互相关函数，并设计最优滤波器过滤加扰数据段中的噪声，最后对输出端的数据按照差分隐私的定义统计隐私保护强度。本发明专利技术中基于滤波的标准化测试方法及装置，解决了现有相关数据差分隐私保护方法的隐私保护性能无法度量和对比的问题，对于相关数据的差分隐私保护具有重要意义。

A Standardized Test Method and Device for Differential Privacy Protection Performance of Relevant Data

The invention discloses a standardized test method and device for differential privacy protection performance of related data. The method divides the scrambled data to be tested by setting a specific length of observation window, calculates the autocorrelation function and cross correlation function of the scrambled data segment, and designs an optimal filter to filter the noise in the scrambled data segment. Finally, the output data is differentiated according to the difference. The definition of privacy counts the intensity of privacy protection. The Standard Test Method and device based on filtering in the invention solves the problem that the privacy protection performance of the existing differential privacy protection methods for related data can not be measured and compared, and is of great significance for differential privacy protection of related data.

全部详细技术资料下载

【技术实现步骤摘要】
一种相关数据差分隐私保护性能的标准化测试方法及装置
本专利技术涉及信息安全技术，尤其涉及一种相关数据差分隐私保护性能的标准化测试方法及装置。
技术介绍
在目前的隐私保护方法中，能够较好地平衡数据安全性和可用性的是Dwork于2006年提出的差分隐私保护框架，它本质上是一种随机扰动策略，具有严格的数学公理化模型，并对攻击者的背景知识没有限制，在保证隐私安全性的同时能够较好的支持数据分析挖掘类应用，近年来成为隐私保护研究的热门领域。差分隐私最初是为了解决由相互独立的数据构成的静态数据集的隐私泄露问题而提出的，通过对统计结果叠加独立同分布的噪声，使得隐私泄露的概率控制在设定的强度范围内。但差分隐私在处理相关数据时，由于待保护数据相关而加入的噪声独立，导致实际有效的隐私保护强度低于预设值。鉴于差分隐私在大数据隐私保护中的独特优势，有很多研究者将其扩展到相关数据的保护。目前的研究者们主要从相关性建模和数据变换两个角度进行改进。相关性建模方面，提出利用马尔可夫模型、贝叶斯模型、相关系数矩阵模型等表示数据的相关性，将模型中的参数作为权重计算差分隐私的全局敏感度函数，并根据全局敏感度函数和设定的隐私保护强度设计噪声；基于数据变换的方式中，主要是将相关数据变换为独立数据进行处理，在变换系数中加入噪声并进行反变换，最后发布反变换后的序列。现有的方法试图利用建模或变换的方式解决相关数据的差分隐私保护问题，但现有方法加入的噪声仍然是独立同分布的，主要存在以下两个问题：①现有方法都是从保护的角度提出相应的解决方案，由于待保护数据相关而噪声独立，从理论上来说，攻击者仍然可以从发布的扰...

【技术保护点】
1.一种相关数据差分隐私保护性能的标准化测试方法，其特征在于，包括以下步骤：步骤S1，数据预处理：读取发布的加扰数据序列，利用设定长度的观测窗口将加扰数据分段，将每个分段数据子序列作为短时平稳过程处理，包括以下子步骤：步骤S1‑1，读入发布的加扰数据集，记为X＝{x1,x2,…,xn}，其中，n为X中的数据个数；步骤S1‑2，设定观测窗口，长度为l，从发布数据集X的第i个数据开始，读入长度为l的待处理的数据段，记为W，W＝{xi,xi+1,…,xi+l‑1}，xi∈X，1≤i≤n‑l；步骤S2，滤波器设计：计算发布的加扰数据段的自相关函数和互相关函数，根据自相关函数和互相关函数设计滤波器，包括以下子步骤：步骤S2‑1，计算观测窗口内数据段W的自相关函数RW(xi,xi+l‑1)，自相关函数RW(xi,xi+l‑1)的计算公式为：

【技术特征摘要】
1.一种相关数据差分隐私保护性能的标准化测试方法，其特征在于，包括以下步骤：步骤S1，数据预处理：读取发布的加扰数据序列，利用设定长度的观测窗口将加扰数据分段，将每个分段数据子序列作为短时平稳过程处理，包括以下子步骤：步骤S1-1，读入发布的加扰数据集，记为X＝{x1,x2,…,xn}，其中，n为X中的数据个数；步骤S1-2，设定观测窗口，长度为l，从发布数据集X的第i个数据开始，读入长度为l的待处理的数据段，记为W，W＝{xi,xi+1,…,xi+l-1}，xi∈X，1≤i≤n-l；步骤S2，滤波器设计：计算发布的加扰数据段的自相关函数和互相关函数，根据自相关函数和互相关函数设计滤波器，包括以下子步骤：步骤S2-1，计算观测窗口内数据段W的自相关函数RW(xi,xi+l-1)，自相关函数RW(xi,xi+l-1)的计算公式为：其中，E[·]表示期望，xtT表示xt的转置；步骤S2-2，计算观测窗口内数据段W的互相关函数PW(xi,xi+l-1)，互相关函数PW(xi,xi+l-1)的计算公式为：步骤S2-3，根据自相关函数和互相关函数计算滤波器的冲激响应,冲激响应的计算方式为：h(n)＝f(RW(xi,xi+l-1))*K(PW(xi,xi+l-1))，其中，f(RW(xi,xi+l-1))和K(PW(xi,xi+l-1))分别是RW(xi,xi+l-1)和PW(xi,xi+l-1)的函数，*表示卷积运算；步骤S3，使用步骤S2获得的滤波器将发布的加扰数据集X滤波，得到滤波后的数据集X′，包括以下子步骤：步骤S3-1，将长度为l的加扰数据段W作为输入端输入到冲激响应为h(n)的滤波器；步骤S3-2，滑动观测窗口，从剩余未处理的数据集中读入l个数据；步骤S3-3，重复步骤S1-2、S2、S3-1和S3-2，直至加扰数据集X处理完毕，得到滤波后的数据集X′；步骤S4，计算隐私强度：分别计算滤波前后X和X′的概率密度Pr(X)、Pr(X′)，计算滤波后有效的隐私保护强度ε′，ε′的计算公式为：2.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法，其特征在于，所述步骤S2-3中，根据自相关函数和互相关函数设计的优选滤波器的冲激响应为h(n)＝RW(xi,xi+l-1)-1PW(xi,xi+l-1)。3.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法，其特征在于，所述步骤S1-2中观测窗口的长度l的取值范围为50至100。4.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法，其特征在于，所述步骤S3-2中，观测窗口的滑动方式包括有相交和不相交两种。5.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法，其特征在于，所述步骤S3-2中，观测窗口的滑动方式为相交滑动，相交数据个数设置为观测窗口的长度的1/3至1/2。6.一种基于滤波的相关数据差分隐私性能标准化测试装置，其特征在于，包括：数据...

【专利技术属性】
技术研发人员：徐正全，王豪，王冬，陈友勤，
申请(专利权)人：武汉华迪世纪计算机有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人