一种基于敏感等级划分的数据扰动方法及装置制造方法及图纸

技术编号：35025976 阅读：24 留言：0更新日期：2022-09-24 22:57

本发明专利技术公开了一种基于敏感等级划分的数据扰动方法及装置，该方法包括：1）对输入值域内每一项数据的敏感度进行评估并确定每个敏感等级的划分标准及对应的隐私预算；2）根据数据敏感度评估结果计算出数据的综合敏感度；3）对照敏感等级的划分标准，确定用户数据敏感等级与隐私预算；4）使用对应的隐私预算对数据进行扰动。本发明专利技术通过对数据的敏感等级进行划分，结合数据自身敏感度与用户的隐私需求为不同等级的数据分配不同的隐私预算进行扰动，能有效地减少噪声引入，提高统计结果的精度。提高统计结果的精度。提高统计结果的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于敏感等级划分的数据扰动方法及装置

[0001]本专利技术涉及数据发布与隐私保护
，具体涉及一种基于敏感等级划分的数据扰动方法及装置。

技术介绍

[0002]随着智能终端设备的普及以及大数据技术的飞速发展，越来越多的网络运营商通过客户端、网络服务等方式收集用户数据，以改善软件及服务的质量，为用户提供更准确、更有价值的内容。一旦发生隐私泄露的问题，不仅会为用户带来很大的风险，还会对企业自身造成经济与名誉上的双重损失。在这样的过程中用户个人隐私的保护是重中之重，如何在数据收集的过程中保护用户个人隐私，是当今社会关注的一个热点问题。
[0003]差分攻击是一种通过比对邻近数据库之间的差异获取信息的隐私攻击方式，传统的隐私保护方式无法防止差分攻击。针对此，有学者提出了一种新的隐私保护模型——差分隐私。差分隐私通过对原有数据添加噪声以达到扰动的作用，与其他隐私保护模型的区别在于差分隐私利用严格的数学定义证明了自身的隐私保护能力，并通过隐私预算参数对隐私保护水平进行量化，能有效地抵抗差分攻击。
[0004]差分隐私依赖于一个可信的第三方服务器，若服务器遭受到隐私攻击还是存在隐私泄露的风险。为了解决这一问题，有学者在差分隐私的基础上提出了本地差分隐私。本地差分隐私将数据扰动的过程放在用户端，由用户对数据进行扰动后再发送给服务器，因此摆脱了对第三方服务器的依赖，大大降低了隐私泄露的风险。
[0005]数据统计分析是本地差分隐私的主要应用与研究热点之一，主要包括对用户数据的频率估计与均值估计。频率估...

【技术保护点】

【技术特征摘要】
1.一种基于敏感等级划分的数据扰动方法，其特征在于，包括：获取输入值域内每一项数据的敏感度，以及划分用户的敏感等级和各敏感等级对应的隐私预算；根据每一项数据的敏感度，计算用户发送数据的综合敏感度；根据用户敏感等级划分，结合所计算的综合敏感度，确定用户发送数据的敏感等级以及敏感等级所对应的隐私预算；对用户发送数据进行填充，使得数据长度达到预设长度；从填充后的用户发送数据中选择一个数据，根据填充后值域的大小选择相应的协议，并基于用户隐私预算对所选择的数据进行扰动。2.根据权利要求1所述的一种基于敏感等级划分的数据扰动方法，其特征在于，所述划分用户的敏感等级和各敏感等级对应的隐私预算，包括：设置k个敏感等级，用L
j
表示第j级对应的敏感节点，其中1≤j≤k且L0＝0,L
j
‑1＜L
j
；当用户的数据敏感度在范围(L
j
‑1,L
j
]时，表示该用户的敏感等级为j；为每个敏感等级设置隐私预算，用∈
j
表示第j级对应的隐私预算，其中，1≤j≤k且∈1＞∈2＞...＞∈
k
。3.根据权利要求2所述的一种基于敏感等级划分的数据扰动方法，其特征在于，所述计算用户发送数据的综合敏感度，包括：其中，S
i
表示用户u
i
的综合敏感度，Q(
·
)表示打分函数，X
i
＝{x1,x2,...,x
m
}表示用户u
i
发送的数据集合，其中x1,x2,...,x
m
∈D且1≤m≤d，D＝{x1,x2,...,x
d
}表示输入值域，m表示用户发送数据个数，d表示输入值域数据个数，表示用户u
i
对于数据x
j
的发送意愿，s
j
表示数据x
j
的敏感度。4.根据权利要求3所述的一种基于敏感等级划分的数据扰动方法，其特征在于，所述确定用户发送数据的敏感等级以及敏感等级所对应的隐私预算，包括：使用二分查找法找到计算得到的综合敏感度S
i
所在的区间，假设是(L
j
‑1,L
j
]，即L
j
‑1≤S
i
≤L
j
，则确定用户发送数据的敏感等级为j，对应的隐私预算为∈
j
。5.根据权利要求3所述的一种基于敏感等级划分的数据扰动方法，其特征在于，所述对用户发送数据进行填充，使得数据长度达到预设长...

【专利技术属性】
技术研发人员：黄屿璁，吕鑫，张潮，高晟凯，李鑫，曾涛，王鑫元，徐振楠，
申请(专利权)人：水利部信息中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人