【技术实现步骤摘要】
一种基于ULDP的Bloom filter编码隐私保护强化方法
[0001]本专利技术涉及信息安全
,尤其涉及一种基于ULDP的Bloom filter编码隐私保护强化方法。
技术介绍
[0002]目前针对Bloom filter编码的隐私保护强化方法有很多,比如Salting、Balancing、XOR
‑
folding、Rule 90、BLIP、WXOR、Re
‑
sampling XOR。这些方法中只有BLIP方法满足差分隐私的要求,XOR
‑
folding、Rule 90、WXOR、Re
‑
sampling XOR主要是使用XOR的性质来进行隐私保护的强化。
[0003]Salting是Niedermeyer等人提出的一种强化方法,通过在哈希前向每个qgram添加一个额外的字符串值,也叫盐值,来避免对Bloom filter的重新识别攻击,其中新添加的字符串值对于单个实体应该非常具体,并且不会随时间而改变。频繁出现的大多数q gram在加盐过后会变得不是很频繁,从而破坏基于频率的解密攻击的条件。Salting方法可以保护隐私,但是会存在不同数据集相同个体的Salting存在与不存在不一致的问题,从而导致匹配结果的下降。
[0004]Balancing方法:针对Bloom filter编码的攻击中,往往会使用Bloom filter的Hamming weight来进行排序,从而找到频繁的q gram或者Bloom fil ...
【技术保护点】
【技术特征摘要】
1.一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:包括读取模块,用于读取不同医院的病人就诊个人识别信息数据,并进行标准化;编码模块,用于将所述个人识别信息编码使得患者信息不被暴露,生成格式统一的数据列标;输出模块,输出加密后的患者数据;所述编码模块采用Utility
‑
optimized Bloomfilter Flip方法或Utility
‑
optimized Laplace noise Addition方法实现。2.如权利要求1所述的一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:所述Utility
‑
optimized Bloom filter Flip方法或Utility
‑
optimized Laplace noise Addition方法的具体方法为:记医院拥有的敏感数据集为Addition方法的具体方法为:记医院拥有的敏感数据集为由n条记录v组成,即通过编码得到的Bloom filter数据集为B,由n个的Bloom filter b组成,即B={b1,b2,...,b
n
},B经过隐私保护强化方法生成Bloom filter数据集B
H
,B
H
由n个Bloom filter b
H
组成,即B
H
={b
H1
,b
H2
,...,b
Hn
};b的长度为l,首先通过编码公共数据集,统计所有Bloom filter每位置1的频数,得到频数F,F={p
i
:f
i
},0≤i≤l
‑
1,并按照频数从高到低的顺序排列,其中p
i
表示位置,f
i
表示每一位置1的频数,参与匹配的医院根据双方商定的敏感数据位所占的比例δ,将F的前δ位分为敏感数据位集合I
S
,I
S
={p
i
,0≤i<δ
·
|F|},|I
S
|=δ
·
l,其余为非敏感数据位集合I
N
,I
N
={p
i
,δ
·
|F|≤i<|F|},由此将所有的输出B
′
划分为隐私保护集合B
P
′
和非隐私保护集合B
N
′
,对于b
′
∈B
P
′
,b
′
中属于I
N
的位置都没有置1,即b
′
={b
i
={0,1},b
j
=0|i∈I
S
,j∈I
N
},否则b
′
属于B
N
′
,B分为B
P
和B
N
,对于b∈B
P
,b中属于IN的位置都没有置1,即b={b
i
={0,1},b
j
=0|i∈I
S
,j∈I
N
},否则b属于B
N
。3.如权利要求2所述的一种基于ULDP的Bloom filter编码隐私保护强化方法,其特征在于:所述Utility
‑
optimized Bloomfilter Flip方法将b生成b
H
的所述隐私保护强化方法具体为:首先b通过机制得到b
′
,机制具体为:设定隐私保护程度计算以的概率将b映射为b
′
,其中,其中具体计算方式为:如果i∈I
S
,如果i∈I
N
,之后根据判断两个Bloom filter是否匹配的阈值s
t
增加WXOR或Re
‑
sampl...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。