一种相关数据差分隐私保护性能的标准化测试方法及装置制造方法及图纸

技术编号:21246772 阅读:26 留言:0更新日期:2019-06-01 07:13
本发明专利技术公开了一种相关数据差分隐私保护性能的标准化测试方法及装置,该方法通过设定特定长度的观测窗口,将待测试的加扰数据分段,然后计算加扰数据段的自相关函数和互相关函数,并设计最优滤波器过滤加扰数据段中的噪声,最后对输出端的数据按照差分隐私的定义统计隐私保护强度。本发明专利技术中基于滤波的标准化测试方法及装置,解决了现有相关数据差分隐私保护方法的隐私保护性能无法度量和对比的问题,对于相关数据的差分隐私保护具有重要意义。

A Standardized Test Method and Device for Differential Privacy Protection Performance of Relevant Data

The invention discloses a standardized test method and device for differential privacy protection performance of related data. The method divides the scrambled data to be tested by setting a specific length of observation window, calculates the autocorrelation function and cross correlation function of the scrambled data segment, and designs an optimal filter to filter the noise in the scrambled data segment. Finally, the output data is differentiated according to the difference. The definition of privacy counts the intensity of privacy protection. The Standard Test Method and device based on filtering in the invention solves the problem that the privacy protection performance of the existing differential privacy protection methods for related data can not be measured and compared, and is of great significance for differential privacy protection of related data.

【技术实现步骤摘要】
一种相关数据差分隐私保护性能的标准化测试方法及装置
本专利技术涉及信息安全技术,尤其涉及一种相关数据差分隐私保护性能的标准化测试方法及装置。
技术介绍
在目前的隐私保护方法中,能够较好地平衡数据安全性和可用性的是Dwork于2006年提出的差分隐私保护框架,它本质上是一种随机扰动策略,具有严格的数学公理化模型,并对攻击者的背景知识没有限制,在保证隐私安全性的同时能够较好的支持数据分析挖掘类应用,近年来成为隐私保护研究的热门领域。差分隐私最初是为了解决由相互独立的数据构成的静态数据集的隐私泄露问题而提出的,通过对统计结果叠加独立同分布的噪声,使得隐私泄露的概率控制在设定的强度范围内。但差分隐私在处理相关数据时,由于待保护数据相关而加入的噪声独立,导致实际有效的隐私保护强度低于预设值。鉴于差分隐私在大数据隐私保护中的独特优势,有很多研究者将其扩展到相关数据的保护。目前的研究者们主要从相关性建模和数据变换两个角度进行改进。相关性建模方面,提出利用马尔可夫模型、贝叶斯模型、相关系数矩阵模型等表示数据的相关性,将模型中的参数作为权重计算差分隐私的全局敏感度函数,并根据全局敏感度函数和设定的隐私保护强度设计噪声;基于数据变换的方式中,主要是将相关数据变换为独立数据进行处理,在变换系数中加入噪声并进行反变换,最后发布反变换后的序列。现有的方法试图利用建模或变换的方式解决相关数据的差分隐私保护问题,但现有方法加入的噪声仍然是独立同分布的,主要存在以下两个问题:①现有方法都是从保护的角度提出相应的解决方案,由于待保护数据相关而噪声独立,从理论上来说,攻击者仍然可以从发布的扰动数据中过滤噪声,导致实际有效的隐私保护强度低于设定值,但目前并没有相应的攻击和标准的测试化方法,来测试现有方法实际有效的隐私保护强度;②由于没有统一的标准化隐私强度测试方法,现有方法的隐私保护性能无法进行横向比较和度量。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种相关数据差分隐私保护性能的标准化测试方法及装置。本专利技术解决其技术问题所采用的技术方案是:一种相关数据差分隐私保护性能的标准化测试方法,包括以下步骤:步骤S1,数据预处理:读取发布的加扰数据序列,利用设定长度的观测窗口将加扰数据分段,将每个分段数据子序列作为短时平稳过程处理,包括以下子步骤:步骤S1-1,读入发布的加扰数据集,记为X={x1,x2,…,xn},其中,n为X中的数据个数;步骤S1-2,设定观测窗口,长度为l,从发布数据集X的第i个数据开始,读入长度为l的待处理的数据段,记为W,W={xi,xi+1,…,xi+l-1},xi∈X,1≤i≤n-l;步骤S2,滤波器设计:计算发布的加扰数据段的自相关函数和互相关函数,根据自相关函数和互相关函数设计滤波器,包括以下子步骤:步骤S2-1,计算观测窗口内数据段W的自相关函数RW(xi,xi+l-1),自相关函数RW(xi,xi+l-1)的计算公式为:其中,E[·]表示期望,xtT表示xt的转置;步骤S2-2,计算观测窗口内数据段W的互相关函数PW(xi,xi+l-1),互相关函数PW(xi,xi+l-1)的计算公式为:步骤S2-3,根据自相关函数和互相关函数计算滤波器的冲激响应,冲激响应的计算方式为:h(n)=f(RW(xi,xi+l-1))*K(PW(xi,xi+l-1)),其中,f(RW(xi,xi+l-1))和K(PW(xi,xi+l-1))分别是RW(xi,xi+l-1)和PW(xi,xi+l-1)的函数,*表示卷积运算;步骤S3,使用步骤S2获得的滤波器将发布的加扰数据集X滤波,得到滤波后的数据集X′,包括以下子步骤:步骤S3-1,将长度为l的加扰数据段W作为输入端输入到冲激响应为h(n)的滤波器;步骤S3-2,滑动观测窗口,从剩余未处理的数据集中读入l个数据;步骤S3-3,重复步骤S1-2、S2、S3-1和S3-2,直至加扰数据集X处理完毕,得到滤波后的数据集X′;步骤S4,计算隐私强度:分别计算滤波前后X和X′的概率密度Pr(X)、Pr(X′),计算滤波后有效的隐私保护强度ε′,ε′的计算公式为:按上述方案,所述步骤S2-3中,根据自相关函数和互相关函数设计的优选滤波器的冲激响应为h(n)=RW(xi,xi+l-1)-1PW(xi,xi+l-1)。按上述方案,所述步骤S1-2中观测窗口的长度l的取值范围为50至100。按上述方案,所述步骤S3-2中,观测窗口的滑动方式包括有相交和不相交两种。按上述方案,所述步骤S3-2中,观测窗口的滑动方式为相交滑动,相交数据个数设置为观测窗口的长度的1/3至1/2。相应的,本专利技术还提供一种基于滤波的相关数据差分隐私性能标准化测试装置,包含:数据预处理模块,用于读入发布的加扰数据,利用设定长度的观测窗口将加扰数据分段,将每个分段数据子序列作为短时平稳过程处理;所述数据预处理模块包含以下子模块,数据读入子模块,用于读入发布的加扰数据集,记为X={x1,x2,…,xn},其中,n为X中的数据个数;滑动窗口子模块,用于通过一个长度为l的观测窗口将读入的原始数据集分段,每个分段数据子序列作为短时平稳过程处理,从加扰数据集X的第i个数据开始,读入长度为l的加扰数据段,记为W,W={xi,xi+1,…,xi+l-1},xi∈X,1≤i≤n-l;滤波器设计模块,用于根据分段数据子序列的自相关函数和互相关函数计算滤波器的冲激响应,冲激响应的计算方式为:h(n)=f(RW(xi,xi+l-1))*K(PW(xi,xi+l-1)),其中,f(RW(xi,xi+l-1))和K(PW(xi,xi+l-1))分别是RW(xi,xi+l-1)和PW(xi,xi+l-1)的函数,*表示卷积运算;所述滤波器设计模块包括自相关函数计算子模块和互相关函数计算子模块;自相关函数计算子模块,计算观测窗口内数据段W的自相关函数RW(xi,xi+l-1),自相关函数RW(xi,xi+l-1)的计算公式为:其中,E[·]表示期望,xtT表示xt的转置;互相关函数计算子模块,用于计算观测窗口内数据段W的互相关函数PW(xi,xi+l-1),互相关函数PW(xi,xi+l-1)的计算公式为:滤波模块,用于对发布的加扰数据集X中的所有分段数据子序列数据滤波,得到滤波后的数据集X′,包含以下子模块,滤波子模块,用于对每段分段数据子序列滤波,将长度为l,自相关函数为RW(xi,xi+l)的加扰数据段W作为输入端输入到冲激响应为h(n)=RW(xi,xi+l-1)-1PW(xi,xi+l-1)的滤波器;迭代处理模块,用于滑动观测窗口,依次将加扰数据集X中未处理的分段数据子序列送入滤波器设计模块;隐私强度统计模块,用于统计滤波前后的隐私保护强度值;分别计算滤波前后X和X′的概率密度Pr(X)、Pr(X′),统计滤波后有效的隐私保护强度ε′,ε′的计算公式为:按上述方案,所述滤波器设计模块中,根据自相关函数和互相关函数计算最优滤波器的冲激响应为h(n)=RW(xi,xi+l-1)-1PW(xi,xi+l-1)。按上述方案,所述滑动窗口子模块中,观测窗口的长度l的取值范围为50至100。按上述方案,所述迭代处理模块中,观测本文档来自技高网
...

【技术保护点】
1.一种相关数据差分隐私保护性能的标准化测试方法,其特征在于,包括以下步骤:步骤S1,数据预处理:读取发布的加扰数据序列,利用设定长度的观测窗口将加扰数据分段,将每个分段数据子序列作为短时平稳过程处理,包括以下子步骤:步骤S1‑1,读入发布的加扰数据集,记为X={x1,x2,…,xn},其中,n为X中的数据个数;步骤S1‑2,设定观测窗口,长度为l,从发布数据集X的第i个数据开始,读入长度为l的待处理的数据段,记为W,W={xi,xi+1,…,xi+l‑1},xi∈X,1≤i≤n‑l;步骤S2,滤波器设计:计算发布的加扰数据段的自相关函数和互相关函数,根据自相关函数和互相关函数设计滤波器,包括以下子步骤:步骤S2‑1,计算观测窗口内数据段W的自相关函数RW(xi,xi+l‑1),自相关函数RW(xi,xi+l‑1)的计算公式为:

【技术特征摘要】
1.一种相关数据差分隐私保护性能的标准化测试方法,其特征在于,包括以下步骤:步骤S1,数据预处理:读取发布的加扰数据序列,利用设定长度的观测窗口将加扰数据分段,将每个分段数据子序列作为短时平稳过程处理,包括以下子步骤:步骤S1-1,读入发布的加扰数据集,记为X={x1,x2,…,xn},其中,n为X中的数据个数;步骤S1-2,设定观测窗口,长度为l,从发布数据集X的第i个数据开始,读入长度为l的待处理的数据段,记为W,W={xi,xi+1,…,xi+l-1},xi∈X,1≤i≤n-l;步骤S2,滤波器设计:计算发布的加扰数据段的自相关函数和互相关函数,根据自相关函数和互相关函数设计滤波器,包括以下子步骤:步骤S2-1,计算观测窗口内数据段W的自相关函数RW(xi,xi+l-1),自相关函数RW(xi,xi+l-1)的计算公式为:其中,E[·]表示期望,xtT表示xt的转置;步骤S2-2,计算观测窗口内数据段W的互相关函数PW(xi,xi+l-1),互相关函数PW(xi,xi+l-1)的计算公式为:步骤S2-3,根据自相关函数和互相关函数计算滤波器的冲激响应,冲激响应的计算方式为:h(n)=f(RW(xi,xi+l-1))*K(PW(xi,xi+l-1)),其中,f(RW(xi,xi+l-1))和K(PW(xi,xi+l-1))分别是RW(xi,xi+l-1)和PW(xi,xi+l-1)的函数,*表示卷积运算;步骤S3,使用步骤S2获得的滤波器将发布的加扰数据集X滤波,得到滤波后的数据集X′,包括以下子步骤:步骤S3-1,将长度为l的加扰数据段W作为输入端输入到冲激响应为h(n)的滤波器;步骤S3-2,滑动观测窗口,从剩余未处理的数据集中读入l个数据;步骤S3-3,重复步骤S1-2、S2、S3-1和S3-2,直至加扰数据集X处理完毕,得到滤波后的数据集X′;步骤S4,计算隐私强度:分别计算滤波前后X和X′的概率密度Pr(X)、Pr(X′),计算滤波后有效的隐私保护强度ε′,ε′的计算公式为:2.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法,其特征在于,所述步骤S2-3中,根据自相关函数和互相关函数设计的优选滤波器的冲激响应为h(n)=RW(xi,xi+l-1)-1PW(xi,xi+l-1)。3.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法,其特征在于,所述步骤S1-2中观测窗口的长度l的取值范围为50至100。4.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法,其特征在于,所述步骤S3-2中,观测窗口的滑动方式包括有相交和不相交两种。5.根据权利要求1所述的相关数据差分隐私保护性能的标准化测试方法,其特征在于,所述步骤S3-2中,观测窗口的滑动方式为相交滑动,相交数据个数设置为观测窗口的长度的1/3至1/2。6.一种基于滤波的相关数据差分隐私性能标准化测试装置,其特征在于,包括:数据...

【专利技术属性】
技术研发人员:徐正全王豪王冬陈友勤
申请(专利权)人:武汉华迪世纪计算机有限公司
类型:发明
国别省市:湖北,42

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1