The invention relates to the privacy protection technology field of graph data publishing, in particular to the degree histogram publishing method of a graph under point difference privacy. The present invention first utilizes the degree-based sorting edge removal method SER to reduce the global sensitivity of the publishing mechanism by projecting the original graph to a compressed graph. Then, based on SER projection method, a degree histogram publishing method which satisfies the point difference privacy is proposed. The simulation results show that, compared with the existing methods, the SER projection method can retain the edge information of the original image to the greatest extent under the same constraints, which lays a good foundation for subsequent data processing. Compared with the existing degree distribution publishing methods, the degree histogram publishing method based on SER projection method has advantages in L1 error and KS distance, which makes the degree distribution after publication closer to the degree distribution of the original graph and higher availability.
【技术实现步骤摘要】
点差分隐私下图的度直方图发布方法
本专利技术涉及图数据发布的隐私保护
,尤其涉及点差分隐私下图的度直方图发布方法。
技术介绍
随着互联网和信息技术的飞速发展,许多组织机构搜集的个人数据规模急剧增长,随之而来的用户隐私保护问题变得日益重要。图数据作为一种典型的数据类型,随着社交网络、推荐系统、协作网络等信息系统的广泛使用而变得越发常见,为解决隐私保护下数据的发布问题,差分隐私被提出,并衍生出两种变体,即边差分隐私和点差分隐私。在边差分隐私中,两个相邻图仅相差一条边,而在点差分隐私中,两个相邻图相差一个节点以及与此节点相连的所有边。对于一个节点数目为n的图G=(V,E)(其中V是所有节点的集合、E为所有边的集合),删除一条边只影响这条边上两个节点度的变化,而删除一个节点在最坏情况下会导致n-1条边被删除。因此,图数据中的点差分隐私比边差分隐私更难满足,但却能提供更高强度的隐私保护。度分布是图的一种重要统计特性,也是图数据发布过程中的保护重点。如何在点差分隐私约束下实现图的度分布发布在近年来得到了广泛关注,其主要目标是要在满足点差分隐私的条件下给出一种尽可能接近图的度的真实分布的近似分布。目前,解决该问题的一种主要技术是将原始图压缩到一个节点度数不超过最大值θ的压缩图,以此来降低度发布过程中的敏感度,而这其中的关键又在于如何在压缩过程中尽可能多地保留原始图的信息。
技术实现思路
针对上述问题,本专利技术提出了点差分隐私下图的度直方图发布方法,提高了差分隐私保护后的数据可用性,发布后的度分布更接近原始图的度分布。为了实现上述目的,本专利技术采用以下技术方案:点差 ...
【技术保护点】
1.点差分隐私下图的度直方图发布方法,其特征在于,所述方法在点差分隐私约束下进行,包括以下步骤:步骤1:选取候选集T,所述候选集T由图G的多个度门限值θ组成;步骤2:计算在隐私预算ε2下候选集T中每个θ的质量函数
【技术特征摘要】
1.点差分隐私下图的度直方图发布方法,其特征在于,所述方法在点差分隐私约束下进行,包括以下步骤:步骤1:选取候选集T,所述候选集T由图G的多个度门限值θ组成;步骤2:计算在隐私预算ε2下候选集T中每个θ的质量函数其中|{v|v∈V,deg(v)>θ}|为图G中度大于θ的节点数量;步骤3:通过指数机制选择节点的度门限值θ*,在隐私预算ε1下,通过指数机制选择最优的θi,其中Δq=2Θ+2;步骤4:采用基于度排序的边移除投影方法SER,通过节点的度门限值θ*对图G的度进行限制,得到投影后的图步骤5:通过拉普拉斯机制对图的累积度直方图加噪,在隐私预算ε2下,其中ch为图的噪声累积度直方图,为图的累积度直方图,Δcumhist=θ+1为拉普拉斯机制下累积度直方图的全局敏感度;步骤6:把累积度直方图转化为度直方图H={h1,h2,...,hθ};步骤7:对度直方图H={h1,h2,...,hθ}进行尾部处理;步骤8:发布点差分隐私保护下的图的度直方图。2.根据权利要求1所述的点差分隐私下图的度直方图发布方法,其特征在于,在所述步骤1之前,还包括:参量初始化。3.根据权利要求1所述的点差分隐私下图的度直方图发布方法,其特征在于,所述θ∈Θ,Θ的大小为100,即所述θ依次取[0,100]中的整数值。4.根据权利要求1所述的点差分隐私下图的度直方图发布方法,其特征在于,所述步骤4包括:步骤4.1:计算图G中所有节点的度deg(i),对[i,deg(i)]按deg(i)从大到小的顺序排列得到列表sorted_l;步骤4.2:对度最大的节点i,如果存在deg...
【专利技术属性】
技术研发人员:魏江宏,张宇轩,胡学先,刘文芬,李霁,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。