基于贝叶斯网络的合成数据隐私增强算法制造技术

技术编号:40326857 阅读:27 留言:0更新日期:2024-02-09 14:20
本发明专利技术为基于贝叶斯网络的合成数据隐私增强算法,涉及数据处理技术领域,计算原始数据的所有属性之间的互信息,采用拉普拉斯机制对互信息进行加噪,并构建贝叶斯网络;然后根据得到的贝叶斯网络,采用等比法为网络中不同的节点按照节点联合分布域大小分配隐私预算,按照不同的隐私预算采用拉普拉斯机制对贝叶斯网络中节点的联合分布进行二次加噪,从带噪联合分布中推导出带噪条件概率分布;根据隐私保护后贝叶斯网络结构和节点的条件概率分布进行前向采样,得到一个合成的数据集。本发明专利技术能够合成与原始数据统计特征相似同时能够实现隐私保护的数据集,合成的数据集能使数据分析者在不接触原始数据集的情况下,挖掘数据中的潜在价值。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体为基于贝叶斯网络的合成数据隐私增强算法


技术介绍

1、数据作为信息时代最重要的生产资料,有着大规模、多样式、高维度、关联复杂等特性,且通常都包含大量的个人隐私信息(例如薪资状况、医疗信息)。随着数据分析技术与机器学习的发展,社会各界对高质量数据的需求变得越来越明显。然而直接共享或发布不经过隐私保护处理的数据,可能会导致隐私的泄露。

2、2023年2月,在联合国大数据和数据科学专家委员(uncebd)发布的《联合国官方统计隐私增强技术指南》中是这样定义隐私增强技术的:隐私增强技术,也被称为隐私保护技术,甚至隐私技术,在使用敏感或机密数据时降低隐私风险的方法和方法,这些方法和方法统称为隐私增强技术(pets)。指南中列举了联合国认可的隐私增强技术:安全多方计算、同态加密、差分隐私、合成数据、分布式学习、零知识证明和可信执行环境。不同于上述隐私增强技术,传统的数据隐私保护方法有不能抵御拥有全部背景知识的敌手攻击的弱点,例如k-匿名,l-多样性,t-贴近性,(α,k)-匿名等,且随着数据维度的增加,高维数据集中的每条记录变本文档来自技高网...

【技术保护点】

1.基于贝叶斯网络的合成数据隐私增强算法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯网络的合成数据隐私增强算法,其特征在于,所述步骤2包括,步骤2-1:计算所有属性与其他属性的平均互信息,将拥有平均互信息最大的节点作为贝叶斯网络的首个节点加入贝叶斯网络;

3.根据权利要求2所述的基于贝叶斯网络的合成数据隐私增强算法,其特征在于,采用拉普拉斯机满足ε1-差分隐私,所述步骤4所得节点带噪条件概率分布满足ε2-差分隐私,合成数据集差分隐私的证明满足(ε1+ε2)-差分隐私,其中ε1:ε2=0.3:0.7。

4.根据权利要求2所述的基于贝叶斯网络的...

【技术特征摘要】

1.基于贝叶斯网络的合成数据隐私增强算法,其特征在于,包括:

2.根据权利要求1所述的基于贝叶斯网络的合成数据隐私增强算法,其特征在于,所述步骤2包括,步骤2-1:计算所有属性与其他属性的平均互信息,将拥有平均互信息最大的节点作为贝叶斯网络的首个节点加入贝叶斯网络;

3.根据权利要求2所述的基于贝叶斯网络的合成数据隐私增强算法,其特征在于,采用拉普拉斯机满足ε1-差分隐私,所述步骤4所得节点带噪条件概率分布满足ε2-差分隐私,合成数据集差分隐私的证明满足(ε1+ε2)-差分隐私,其中ε1:ε2=0.3:0.7。

4.根据权利要求2所述的基于贝叶斯网...

【专利技术属性】
技术研发人员:朴春慧卢晓天杨新法杨兴雨
申请(专利权)人:石家庄铁道大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1