一种基于ULDP的Bloomfilter编码隐私保护强化方法技术

技术编号:36894839 阅读:9 留言:0更新日期:2023-03-15 22:22
本发明专利技术通过网络安全领域的方法,实现了一种基于ULDP的Bloomfilter编码隐私保护强化方法。包括读取模块,用于读取不同医院的病人就诊个人识别信息数据,并进行标准化;编码模块,用于将所述个人识别信息编码使得患者信息不被暴露,生成格式统一的数据列标;输出模块,输出加密后的患者数据;所述编码模块采用Utility

【技术实现步骤摘要】
一种基于ULDP的Bloom filter编码隐私保护强化方法


[0001]本专利技术涉及信息安全
,尤其涉及一种基于ULDP的Bloom filter编码隐私保护强化方法。

技术介绍

[0002]目前针对Bloom filter编码的隐私保护强化方法有很多,比如Salting、Balancing、XOR

folding、Rule 90、BLIP、WXOR、Re

sampling XOR。这些方法中只有BLIP方法满足差分隐私的要求,XOR

folding、Rule 90、WXOR、Re

sampling XOR主要是使用XOR的性质来进行隐私保护的强化。
[0003]Salting是Niedermeyer等人提出的一种强化方法,通过在哈希前向每个qgram添加一个额外的字符串值,也叫盐值,来避免对Bloom filter的重新识别攻击,其中新添加的字符串值对于单个实体应该非常具体,并且不会随时间而改变。频繁出现的大多数q gram在加盐过后会变得不是很频繁,从而破坏基于频率的解密攻击的条件。Salting方法可以保护隐私,但是会存在不同数据集相同个体的Salting存在与不存在不一致的问题,从而导致匹配结果的下降。
[0004]Balancing方法:针对Bloom filter编码的攻击中,往往会使用Bloom filter的Hamming weight来进行排序,从而找到频繁的q gram或者Bloom filter中的某些位置。Balancing将每一个Bloom filter的Hamming weight都变为长度的一半来破坏该条件。其将原长度为l的Bloom filter每一位翻转,然后拼接到原Bloom filter后方来使最终的BF具有平衡的特性。平衡指Bloom filter的Hamming weight等于长度的一半。在拼接之后还会对长度为2l的Bloom filter进行打乱以进一步保护隐私。然而,平衡后的Bloom filter比原Bloom filter需要更多的空间。Balancing方法计算隐私保护强化的Bloom filter,b
H
的计算公式如下所示:b
H
=shuffle(b+~b)其中b为原Bloom filter,~b表示Bloom filter每一位取反,shuffle()表示将Bloom filter打乱。Balancing方法可以保护隐私,但是对于基于模式挖掘的攻击方法并不能起作用。Balancing方法因为需要拼接登场的Bloom filter,所以会导致增加方法的空间复杂度。
[0005]XOR

folding方法:Schnell和Borgs提出了一种使用向量折叠与逐位XOR(异或)操作相结合的方法,来提高Bloom filter的隐私保护效果。该方法首先将长度为l的Bloom filter分为长度相同的2份,即b1和b2,每部分长度为l/2,b1[i]=b[i],b2[i]=b[i+l/2],其中1≤i<l/2,隐私保护强化的Bloom Filter,b
H
计算如下所示:其中表示异或计算。因为异或操作的特性,攻击者无法判断原位置的真值,并且异或隐含了原Bloom Filter中置1位的信息,对密码分析攻击有较大的容忍度。XOR

folding方法可以保护隐私,但是对于基于模式挖掘的攻击方法并不能起作用。并且XOR

folding方法不满足差分隐私。
[0006]Rule 90方法:Wolfram的Rule 90是用于细胞自动机的规则,该规则使用每一位左右两位的值进行异或计算来生成该位的新值。Schnell和Borgs提出使用Rule 90作为Bloom filter编码的隐私保护强化技术,因为它与XOR

folding一样,是一个不可逆的过程。隐私
保护强化后的Bloom filter,b
H
每一位的计算公式如下所示,其中1≤i<l,表示异或计算。当在计算第一位时,其左边没有值,这时候就会使用最后一位作为第一位左侧的值,同样计算最后一位时,需要第一位来作为最后一位右侧的值,所以式(2.6)需要使用mod。但Rule 90方法不满足差分隐私。
[0007]Bloom and Flip(BLIP)方法:Bloom and Flip(BLIP)根据Random Response(RR)机制随机翻转Bloom Filter中每一位的值。RR机制是差分隐私(Differential Privacy,DP)概念下的一个机制。BLIP方法类似于RAPPOR方法。对于Bloom filter b的每一位,假设其有p的概率翻转,在其翻转时,其有1/2的概率变为1,有1/2的概率变为0,该位不翻转的概率为1

p。那么对于Bloom filter b的i位置对应隐私保护强化后的Bloom filter b
H
的计算可以得到如下的式子:其中0≤i<l。当p=0.05时,如果l=1000,意味着大约每一个Bloom filter会有50位翻转,大约有25位会变成与原值相反的值,剩下的值不会改变。Vaiwsri等人最近的工作研究了通过上述BLIP方法强化的Bloom filter数据集的匹配质量。这项工作发现,BLIP会降低匹配质量,尤其是随着翻转概率p的增加。在某些p设置下,召回率显著下降,导致几乎找不到真实匹配。Vaiwsri等人基于参考值改进了BLIP。他们的方法使用伪随机数发生器(PRNG)随机生成要随机化的比特位置序列。这种方法能够提高大多数BLIP参数设置的匹配质量,但是不能满足差分隐私。BLIP方法只有在隐私代价较大的情况下才能有较好的匹配效果,并且在相似度阈值较大的情况下召回率较低,在相似度阈值较小的情况下,准确率较低。
[0008]WXOR方法:Thilina Ranbaduge中提出的WXOR方法过程如图1所示。该方法着重于应用滑动窗口方法来强化Bloom filter。在这种方法中,有两个窗口大小为w的滑动窗口W1和W2沿着长度为l的Bloom filter迭代移动。在每次迭代中,窗口W1和W2每次移动1位。然后将这两个窗口按照每一位XOR的方式,计算出的一个新的值赋值给W1。重复这些步骤,直到处理整个Bloom filter生成新的强化的Bloom filter b
H
。但WXOR方法不满足差分隐私。
[0009]Re

sampling XOR方法:Re

sampling XOR是Thilina Ranbaduge提出的第二种强化方法。该方法首先初始化一个新的强化后的Bloom filter b
H
,对于强化后的b
H
的每一位i在原B本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:包括读取模块,用于读取不同医院的病人就诊个人识别信息数据,并进行标准化;编码模块,用于将所述个人识别信息编码使得患者信息不被暴露,生成格式统一的数据列标;输出模块,输出加密后的患者数据;所述编码模块采用Utility

optimized Bloomfilter Flip方法或Utility

optimized Laplace noise Addition方法实现。2.如权利要求1所述的一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:所述Utility

optimized Bloom filter Flip方法或Utility

optimized Laplace noise Addition方法的具体方法为:记医院拥有的敏感数据集为Addition方法的具体方法为:记医院拥有的敏感数据集为由n条记录v组成,即通过编码得到的Bloom filter数据集为B,由n个的Bloom filter b组成,即B={b1,b2,...,b
n
},B经过隐私保护强化方法生成Bloom filter数据集B
H
,B
H
由n个Bloom filter b
H
组成,即B
H
={b
H1
,b
H2
,...,b
Hn
};b的长度为l,首先通过编码公共数据集,统计所有Bloom filter每位置1的频数,得到频数F,F={p
i
:f
i
},0≤i≤l

1,并按照频数从高到低的顺序排列,其中p
i
表示位置,f
i
表示每一位置1的频数,参与匹配的医院根据双方商定的敏感数据位所占的比例δ,将F的前δ位分为敏感数据位集合I
S
,I
S
={p
i
,0≤i<δ
·
|F|},|I
S
|=δ
·
l,其余为非敏感数据位集合I
N
,I
N
={p
i
,δ
·
|F|≤i<|F|},由此将所有的输出B

划分为隐私保护集合B
P

和非隐私保护集合B
N

,对于b

∈B
P

,b

中属于I
N
的位置都没有置1,即b

={b
i
={0,1},b
j
=0|i∈I
S
,j∈I
N
},否则b

属于B
N

,B分为B
P
和B
N
,对于b∈B
P
,b中属于IN的位置都没有置1,即b={b
i
={0,1},b
j
=0|i∈I
S
,j∈I
N
},否则b属于B
N
。3.如权利要求2所述的一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:所述Utility

optimized Bloomfilter Flip方法将b生成b
H
的所述隐私保护强化方法具体为:首先b通过机制得到b

,机制具体为:设定隐私保护程度计算以的概率将b映射为b

,其中,其中具体计算方式为:如果i∈I
S
,如果i∈I
N
,之后根据判断两个Bloom filter是否匹配的阈值s
t
增加WXOR或Re

sampl...

【专利技术属性】
技术研发人员:马帅岳文海
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1