基于本地差分隐私的效用优化键值数据保护方法、装置制造方法及图纸

技术编号:37158527 阅读:26 留言:0更新日期:2023-04-06 22:21
本发明专利技术公开了一种基于本地差分隐私的效用优化键值数据保护方法、装置,所述方法包括:对键域划分为敏感数据域和非敏感数据域,并向用户公开;用户对本地键值数据区分为敏感键值数据和非敏感键值数据,分别进行扰动,得到隐私键值数据,将隐私键值数据发送至服务器;服务器收集多个用户的隐私键值数据,分别对其中的敏感隐私键值数据和非敏感隐私键值数据中的键数据和值数据进行统计,计算得到原始键值数据中的键数据的频率分布和值数据的均值。采用上述技术方法,在用户本地根据隐私的重要程度采用不同的扰动方式,区别相应的保护力度,保护用户隐私的同时,提高了整体的数据效用,以及频率估计与均值估计结果的准确度。以及频率估计与均值估计结果的准确度。以及频率估计与均值估计结果的准确度。

【技术实现步骤摘要】
基于本地差分隐私的效用优化键值数据保护方法、装置


[0001]本专利技术涉及信息安全
,尤其涉及一种基于本地差分隐私的效用优化键值数据保护方法、装置。

技术介绍

[0002]随着经济科技的迅速发展,智能终端等设备也愈发普及,随之产生的用户数据被相关公司收集、研究。键值数据就是现实生活中一种很常见的数据形式,有着广泛的应用场景。通过分析键值数据,可以挖掘出它们中的隐藏信息,进而为用户提供更好的服务。如收集用户的视频浏览记录,分析用户偏好并完善推荐系统,收集用户的医疗记录,为用户提供疾病的预期诊断。但是同时,这些数据中也往往包含着大量的隐私信息,如果直接将其提供给其他人使用,会对用户的人身、财产安全造成极大的威胁,这也会使得用户共享数据的意愿降低。因此,如何在保护用户隐私的前提下,对数据进行收集、分析和发布,是一个亟待解决的问题。
[0003]差分隐私是一种隐私保护模型,与其他隐私保护技术不同的是,差分隐私有着严格的数学形式化安全性证明支撑和高效低开销的特点,并且可以对隐私保护程度进行量化,同时不需要考虑攻击者拥有多少背景知识。在传统本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于本地差分隐私的效用优化键值数据保护方法,其特征在于,包括:服务器对键数据对应的键域,划分为敏感数据域和非敏感数据域,将敏感数据域和非敏感数据域向用户公开;用户依据公开的敏感数据域和非敏感数据域,对本地键值数据区分为敏感键值数据和非敏感键值数据,分别对敏感键值数据和非敏感键值数据进行扰动,得到隐私键值数据,将隐私键值数据发送至服务器;服务器收集多个用户的隐私键值数据,依据敏感数据域和非敏感数据域进行划分,得到敏感隐私键值数据和非敏感隐私键值数据,分别对敏感隐私键值数据和非敏感隐私键值数据中的键数据和值数据进行统计,计算得到原始键值数据中的键数据的频率分布和值数据的均值。2.根据权利要求1所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,所述将敏感数据域和非敏感数据域向用户公开,包括:将敏感数据域、非敏感数据域和隐私预算向用户公开。3.根据权利要求2所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,用户对本地键值数据进行扰动之前,对值数据和对应的值域进行标准化,采用如下标准化公式进行标准化:v
i

=2(v
i

a)/(b

a)

1,其中,v
i
表示第i个值数据,值数据的值域为[a,b],v
i

表示v
i
标准化后的值数据,通过标准化公式,将值域标准化为[

1,1]。4.根据权利要求3所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,所述分别对敏感键值数据和非敏感键值数据进行扰动,包括:将敏感键值数据的键数据扰动至被保护输出中,将非敏感键值数据的键数据扰动至被保护输出或不被保护输出中;若键数据被扰动至被保护输出中,键数据依据第一概率保持不变,依据第二概率转换为扰动键数据,对应的值数据依据隐私预算概率保持不变或转换为扰动值数据;键数据依据第三概率被扰动至不被保护输出中,若键数据被扰动至不被保护输出中,键数据保持不变,对应的值数据保持不变;扰动键数据和敏感数据域的键域相同。5.根据权利要求4所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,若键数据被扰动至被保护输出中,包括:对应的值数据依据第四概率离散至

1或1;按照如下公式确定是否将键数据转换为扰动键数据:C1+(|U
s
|

1)C2=1,其中,C1表示第一概率,C2表示第二概率,U
s
表示敏感数据域;若键数据保持不变,对应的值数据在离散后依据隐私预算概率p转换为原始值数据,依据概率(1

p)转换为负值;若键数据转换为扰动键数据,对应的值数据在离散后依据第五概率q转换为原始值数据,依据概率(1

q)转换为负值。6.根据权利要求5所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,所述第三概率C3,按照如下公式计算:C3+|U
s
|C2=1;
所述对应的值数据依据第四概率离散至

1或1,包括:依据(1

v
o
)/2或(1+v
o
)/2分别离散至

1或1,其中v
o
表示所述对应的值数据的原始值数据。7.根据权利要求6所述的基于本地差分隐私的效用优化键值数据保护方法,其特征在于,所述分别对敏感隐私键值数据和非敏感隐私键值数据中的键数据和值数据...

【专利技术属性】
技术研发人员:王凤祥朱友文
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1