基于不变后随机响应技术的数据库敏感关联属性脱敏方法技术

技术编号:23765297 阅读:43 留言:0更新日期:2020-04-11 19:30
本发明专利技术涉及基于不变后随机响应技术的数据库敏感关联属性脱敏方法,与现有技术相比解决了未充分考虑数据属性相关隐私风险的缺陷。本发明专利技术包括以下步骤:原始数据的分析;敏感关联属性的脱敏处理。本发明专利技术在考虑数据库中存储数据的准标识符属性与敏感属性存在依赖关系的基础上,对数据库中的敏感数据进行脱敏来保护用户隐私,并增强数据效用。

Desensitization method of database sensitive Association attribute based on invariant post random response technology

【技术实现步骤摘要】
基于不变后随机响应技术的数据库敏感关联属性脱敏方法
本专利技术涉及数据库处理
,具体来说是基于不变后随机响应技术的数据库敏感关联属性脱敏方法。
技术介绍
随着社会的进步和科技的发展,数据库中存储了海量的数据,人们可以从中提取出很多有价值的信息,但是这些数据所包含的信息也可能泄露出用户的隐私。随机响应(RandomResponse,RR)技术最初作为消除统计偏差的一种手段,主要思想是利用不确定性来保护敏感信息,而如今广义的随机响应是根据一定的概率将原始值扰动为其他值。在随机响应的基础上,Kooiman等人提出后随机响应(PostRandomizationMethod,PRAM),在数学上与随机响应类似,都在保护用户隐私信息基础上研究如何提高统计精度。差分隐私(DifferentialPrivacy)由Dwork提出,相比于之前的隐私保护模型k-匿名以及它的扩展模型,差分隐私不对攻击者的背景做任何假设,能够提供更加强大的隐私保护能力,并且拥有坚实的数学基础,能对隐私保护进行严格的定义并进行量化评估。局部差分隐私(LocalDiffer本文档来自技高网...

【技术保护点】
1.一种基于不变后随机响应技术的数据库敏感关联属性脱敏方法,其特征在于,包括以下步骤:/n11)原始数据的分析:根据数据库中原始数据的准标识符属性和敏感属性关系强度,分析出数据库中属性间的关联关系;/n12)敏感关联属性的脱敏处理:对敏感属性以及与敏感属性具有强依赖关系的准标识符属性进行脱敏处理。/n

【技术特征摘要】
1.一种基于不变后随机响应技术的数据库敏感关联属性脱敏方法,其特征在于,包括以下步骤:
11)原始数据的分析:根据数据库中原始数据的准标识符属性和敏感属性关系强度,分析出数据库中属性间的关联关系;
12)敏感关联属性的脱敏处理:对敏感属性以及与敏感属性具有强依赖关系的准标识符属性进行脱敏处理。


2.根据权利要求1所述的基于不变后随机响应技术的数据库敏感关联属性脱敏方法,其特征在于,所述原始数据的分析包括以下步骤:
21)依次计算原始数据中准标识符属性和敏感属性间的依赖度,当准标识符属性存在数值型属性时,先对准标识符属性进行离散化处理,其依赖度计算公式如下:



其中为Ai属性值的个数,为Ai属性的第z个属性值;
准标识符属性表示为{Ai|i=1,…,m},i表示准标识符属性个数,敏感属性表示为{Si|i=1,…,k},k敏感属性个数,将敏感属性的个数设置为1,当敏感属性超过1时,按照准标识符属性的处理方式进行扩充,ds为敏感属性值个数,为敏感属性第z个属性值,Pr为概率符号;
22)计算出所有准标识符属性和敏感属性间的依赖度,并进行比较;当依赖度大于设定阈值时输出准标识符属性,作为与敏感属性具有强依赖关系的准标识符属性进行扰动处理。


3.根据权利要求1所述的基于不变后随机响应技术的数据库敏感关联属性脱敏方法,其特征在于,所述的对敏感属性以及与敏感属性具有强依赖关系的准标识符属性的原始数据中二值属性进行脱敏处理包括以下步骤:
31)对原始数据中敏感属性和需要进行扰动的标识符属性中的属性变量X使用矩阵PB进行扰动,其中,u、v为假设的二值属性的两个值,PB为概率转移矩阵,pu、pv为对应值的转移概率;



用矩阵PB对原...

【专利技术属性】
技术研发人员:杨高明裴成飞方贤进朱海明
申请(专利权)人:安徽理工大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1