【技术实现步骤摘要】
一种基于效用矩阵实现l
‑
diversity匿名的方法
[0001]本专利技术涉及隐私保护和信息安全
,具体的说是一种基于效用矩阵实现l
‑
diversity匿名的方法。
技术介绍
[0002]社会信息化和网络化的发展导致数据爆炸式增长,以大数据为基础的数据密集型应用引发了人们的广泛关注,其中数据的安全与隐私问题是人们公认的关键问题之一。当前,人们在互联网上的一言一行都掌握在互联网商家手中,包括购物习惯、好友联络情况、阅读习惯、检索习惯等等,多项实际案例说明,即使无害的数据被大量收集后,也会暴露个人隐私。
[0003]在信息化的背景下,商家既是数据的生产者,又是数据的存储、管理者和使用者,因此单纯通过常规手段限制商家对用户信息的收集,实现用户隐私保护是极其困难的。此外,当前企业常常认为经过简单隐藏关键信息后,不包含用户的标识符的信息就可以公开发布。但事实上仅通过简单隐藏关键信息并不能很好地达到隐私保护的目的,别有用心者仍然能通过信息交叉对比等方式识别出用户的关键信息。数据发布时使用技术手段进行匿名保护是实现隐私保护的核心关键技术与基本手段。
技术实现思路
[0004]本专利技术针对目前技术发展的需求和不足之处,提供一种基于效用矩阵实现l
‑
diversity匿名的方法。
[0005]l
‑
diversity,即L
‑
多样性,它表示:在公开的数据中,每一个等价类里的敏感属性必须具有多样性,即L ...
【技术保护点】
【技术特征摘要】
1.一种基于效用矩阵实现l
‑
diversity匿名的方法,其特征在于,包括如下步骤:S1、获取用户属性标识,引入效用矩阵,计算效用矩阵所包含元素的取值概率;S2、设定参数L、聚类个数N,利用基于划分的聚类算法,对用户属性标识中敏感属性的值进行聚类,并输出聚类结果;S3、判断步骤S2输出的聚类结果中存在敏感属性值的个数是否小于参数L的设定值,若是,则执行步骤S4,若否,则直接结束,并根据聚类结果对用户属性标识中的敏感属性值进行匿名;S4、设定聚类次数K的阈值,判断输出聚类结果时进行的聚类次数是否超过K的设定阈值,若是,则将聚类个数N减1后返回执行步骤S2,若否,则直接返回执行步骤S2。2.根据权利要求1所述的一种基于效用矩阵实现l
‑
diversity匿名的方法,其特征在于,执行步骤S1,获取的用户属性标识包括显示标识符、准标识符、敏感属性三类,其中,显示标识符能唯一标识单一个体的属性,多个准标识符组合起来能唯一标识一个用户的多个属性,敏感属性为涉及隐私的属性;多个用户的属性标识存储在同一个数据集内,不同用户的属性标识存储在不同的数据子集内。3.根据权利要求2所述的一种基于效用矩阵实现l
‑
diversity匿名的方法,其特征在于,执行步骤S1,引入效用矩阵,计算效用矩阵所包含元素的取值概率,具体操作流程如下:S1.1、引入效用矩阵,效用矩阵的定义如下:U=(u
ij
)
m
×
n
,
ꢀꢀꢀꢀꢀꢀꢀ
公式(a)其中,矩阵元素u
ij
表示准标识符中第j个属性对敏感属性中第i个属性的效用,m是敏感属性包含的属性个数,n是准标识符包含的属性个数;S1.2、获取用户的准标识符和敏感属性,利用效用矩阵计算矩阵元素u
ij
的取值概率,计算公式如下:其中,是矩阵元素u
ij
的值,表示q
j
对s
i
的取值概率,s
i
表示敏感属性中第i个属性的值,q
j
表示准标识符中第j个属性的值。4.根据权利要求3所述的一种基于效用矩阵实现l
‑...
【专利技术属性】
技术研发人员:侯令晨,周永进,李国涛,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。