一种面向图中三角形数据发布的隐私保护方法及系统技术方案

技术编号:20363960 阅读:26 留言:0更新日期:2019-02-16 17:00
本发明专利技术公开了一种面向图中三角形数据发布的隐私保护方法及系统,该方法包括:将原图数据进行删边得到单个节点连接三角个数阈值为λ的新图;计算三角个数与对应节点个数的直方图敏感度上界,以决定加入噪声量并发布加噪后的三角个数分布直方图;计算三角个数与对应节点个数的累积直方图敏感度上界,并发布加噪后的三角分布累积直方图;将节点本地聚类系数分成k组,计算分组后的聚类系数与对应每组节点个数的分布直方图的敏感度上界,发布其加噪后的聚类系数分布直方图;计算分组后的聚类系数累积直方图的敏感度上界,并发布加噪后的聚类系数累积直方图。本发明专利技术在保证隐私的前提下发布大图数据的三角计算结果,具有一定的可用性和安全性。

【技术实现步骤摘要】
一种面向图中三角形数据发布的隐私保护方法及系统
本专利技术属于图数据处理领域,更具体地,涉及一种面向图中三角形数据发布的隐私保护方法及系统。
技术介绍
随着近年来互联网的快速发展,信息技术日新月异,大数据时代已经到来,越来越多的人们通过社交网站(如Facebook、Twitter、微博等)进行日常沟通交流。而这类社交网站系统存储着大量的用户数据,对这些用户数据进行收集和分析可以帮助人们更好地认识真实世界的规律,这类需求极大地促进了数据的发布和共享。社会网络分析也已经成为社会学、地理学、经济学、信息学等诸多学科的研究热点。然而真实的用户数据往往包含着用户的各类隐私信息,如个人的真实姓名、电话、住址、亲友关系、消费习惯等等,这些信息往往具有极强的个人特征。在如今的互联网使用过程中,尽管人们越来越关注他们在互联网上的隐私问题,但各类隐私信息泄露事故仍时常发生。因此在发布对数据的研究结果时,仅仅删除其中数据的标识符(如姓名、ID等)是不够的,一些攻击案例已经充分证明这种简单的操作不足以完全保护用户的隐私信息,这就带来了隐私泄露的问题以及学术界和工业界对隐私保护的不懈研究。隐私保护的方法大致可以分为两类:基于数据匿名化的隐私保护方法和基于数据扰动的隐私保护方法。基于匿名的方法主要用于临时攻击,如结构攻击等。近年来,出现了许多基于K-匿名和划分的隐私保护方法(如L-diversity、t-closeness、(a,k)-anonymity等),尽管这些隐私保护方法能够对数据进行一定的隐私保护,但是都是在一定的前提条件和背景知识下的,对于一些攻击方式(如交叉攻击、组合攻击等)并不能达到隐私保护的效果。而差分隐私保护技术主要是通过对原始数据添加噪声扰动,使数据失真来实现隐私保护效果的。对差分隐私保护技术的研究并使其更好的应用于更多的领域具有非常重要的意义。
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种面向图中三角形数据发布的隐私保护方法及系统,由此解决现有隐私保护方法存在的隐私保护效果存在一定局限性的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种面向图中三角形数据发布的隐私保护方法,包括:(1)将原图数据进行删边的预处理操作,以得到单个节点连接的三角个数阈值为λ的新图;(2)在新图的基础上,计算并证明三角个数与对应节点个数的直方图敏感度上界,由此决定加入噪声量并发布加噪后的三角个数分布直方图;(3)在新图的基础上,计算并证明三角个数与对应节点个数的累积直方图敏感度上界,并发布加噪后的三角分布累积直方图;(4)在新图的基础上,将节点本地聚类系数分成k组,计算并证明分组后的聚类系数与对应每组的节点个数分布直方图的敏感度上界,发布其加噪后的聚类系数分布直方图;(5)在新图的基础上,计算并证明分组后的聚类系数的累积直方图敏感度上界,并发布加噪后的聚类系数累积直方图。优选地,步骤(1)包括:(1.1)统计每个节点所连接的三角形个数,记为Trii(G),其中,下标i表示当前节点编号,G表示当前作用的图;(1.2)统计每个节点所连接的节点个数,记为Degi(G);(1.3)记录每个节点vi的邻节点序列为LinkNode(vi);(1.4)遍历所有节点,判断当前节点vi所连接的三角形个数Trii(G)是否大于预设阈值λ,若满足Trii(G)>λ,则删除当前节点vi与所对应的邻节点之间的连边,并更新当前节点vi的三角形个数,直至新的Trii(G)≤λ,然后更新全部节点的Tri(G),按照步骤(1.4)继续判断下一个节点,直至完成所有节点的删边操作。优选地,步骤(2)包括:(2.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(2.2)统计Tri(G)=i的节点的个数,记为histi(Gλ),其中,i表示节点所连的三角个数为i;(2.3)通过对histi(Gλ)添加敏感度为4λ+1的噪声,记为Trλ(G),其中,表示所添加的噪声量,∈为隐私保护算子,表示加噪之后连接三角个数为i的节点个数;(2.4)发布加噪后的节点三角个数分布直方图Trλ(G)。优选地,步骤(3)包括:(3.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(3.2)统计Tri(G)≥i的节点的个数,记为histi(Gλ);(3.3)通过对histi(Gλ)添加敏感度为2λ+1的噪声,记为TCλ(G),其中,表示加噪之后连接三角个数不大于i的节点个数;(3.4)发布加噪后的节点三角个数累积分布直方图TCλ(G)。优选地,步骤(4)包括:(4.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(4.2)统计每个节点所连接的节点个数,记为Degλ(i),其中,i表示当前节点编号;(4.3)统计每个节点所连接的三角形个数,记为Triλ(i);(4.4)计算每个节点的本地聚类系数:其中,LCi(Gλ)表示;(4.5)将集合[0,1]均分为k个集合,根据各节点的聚类系数LCi(Gλ)的值将各节点分别归类于k个集合中,计算k个集合中每个集合中元素的个数,记为histi(Gλ),其中1≤i≤k;(4.6)通过对histi(Gλ)添加敏感度为4λ+1的噪声,记为LCk(Gλ),其中,表示加噪后的第i组数据中的节点个数;(4.7)发布加噪后的节点聚类系数分布直方图LCk(Gλ)。优选地,步骤(5)包括:(5.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(5.2)统计每个节点所连接的节点个数,记为Degλ(i);(5.3)统计每个节点所连接的三角形个数,记为Triλ(i);(5.4)计算每个节点的本地聚类系数:(5.5)将集合[0,1]均分为k个集合,根据各节点的聚类系数LCi(Gλ)的值将各节点分别归类于这k个集合中,计算这k个集合每个集合中元素的个数,记为histi(Gλ),其中1≤i≤k;(5.6)通过histi←histi+histi-1将histi(Gλ)进行累积,其中i从1遍历至k;(5.7)通过对histi(Gλ)添加敏感度为2λ(k-1)+k的噪声,记为CLCk(Gλ),其中,表示加噪后的第i组数据中的节点个数;(5.8)发布加噪后的节点聚类系数累积分布直方图CLCk(Gλ)。按照本专利技术的另一方面,提供了一种面向图中三角形数据发布的隐私保护系统,包括:图形预处理模块,用于将原图数据进行删边的预处理操作,以得到单个节点连接的三角个数阈值为λ的新图;三角个数发布模块,用于在新图的基础上,计算并证明三角个数与对应节点个数的直方图敏感度上界,由此决定加入噪声量并发布加噪后的三角个数分布直方图;及,在新图的基础上,计算并证明三角个数与对应节点个数的累积直方图敏感度上界,并发布加噪后的三角分布累积直方图;聚类系数发布模块,用于在新图的基础上,将节点本地聚类系数分成k组,计算并证明分组后的聚类系数与对应每组的节点个数分布直方图的敏感度上界,发布其加噪后的聚类系数分布直方图;及,在新图的基础上,计算并证明分组后的聚类系数的累积直方图敏感度上界,并发布加噪后的聚类系数累积直方图。总体而言,通过本专利技术所构思的以上技本文档来自技高网
...

【技术保护点】
1.一种面向图中三角形数据发布的隐私保护方法,其特征在于,包括:(1)将原图数据进行删边的预处理操作,以得到单个节点连接的三角个数阈值为λ的新图;(2)在新图的基础上,计算并证明三角个数与对应节点个数的直方图敏感度上界,由此决定加入噪声量并发布加噪后的三角个数分布直方图;(3)在新图的基础上,计算并证明三角个数与对应节点个数的累积直方图敏感度上界,并发布加噪后的三角分布累积直方图;(4)在新图的基础上,将节点本地聚类系数分成k组,计算并证明分组后的聚类系数与对应每组的节点个数分布直方图的敏感度上界,发布其加噪后的聚类系数分布直方图;(5)在新图的基础上,计算并证明分组后的聚类系数的累积直方图敏感度上界,并发布加噪后的聚类系数累积直方图。

【技术特征摘要】
1.一种面向图中三角形数据发布的隐私保护方法,其特征在于,包括:(1)将原图数据进行删边的预处理操作,以得到单个节点连接的三角个数阈值为λ的新图;(2)在新图的基础上,计算并证明三角个数与对应节点个数的直方图敏感度上界,由此决定加入噪声量并发布加噪后的三角个数分布直方图;(3)在新图的基础上,计算并证明三角个数与对应节点个数的累积直方图敏感度上界,并发布加噪后的三角分布累积直方图;(4)在新图的基础上,将节点本地聚类系数分成k组,计算并证明分组后的聚类系数与对应每组的节点个数分布直方图的敏感度上界,发布其加噪后的聚类系数分布直方图;(5)在新图的基础上,计算并证明分组后的聚类系数的累积直方图敏感度上界,并发布加噪后的聚类系数累积直方图。2.根据权利要求1所述的方法,其特征在于,步骤(1)包括:(1.1)统计每个节点所连接的三角形个数,记为Trii(G),其中,下标i表示当前节点编号,G表示当前作用的图;(1.2)统计每个节点所连接的节点个数,记为Degi(G);(1.3)记录每个节点vi的邻节点序列为LinkNode(vi);(1.4)遍历所有节点,判断当前节点vi所连接的三角形个数Trii(G)是否大于预设阈值λ,若满足Trii(G)>λ,则删除当前节点vi与所对应的邻节点之间的连边,并更新当前节点vi的三角形个数,直至新的Trii(G)≤λ,然后更新全部节点的Tri(G),按照步骤(1.4)继续判断下一个节点,直至完成所有节点的删边操作。3.根据权利要求2所述的方法,其特征在于,步骤(2)包括:(2.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(2.2)统计Tri(G)=i的节点的个数,记为histi(Gλ),其中,i表示节点所连的三角个数为i;(2.3)通过对histi(Gλ)添加敏感度为4λ+1的噪声,记为Trλ(G),其中,表示所添加的噪声量,∈为隐私保护算子,表示加噪之后连接三角个数为i的节点个数;(2.4)发布加噪后的节点三角个数分布直方图Trλ(G)。4.根据权利要求3所述的方法,其特征在于,步骤(3)包括:(3.1)对输入的无向图G进行步骤(1)的处理得到节点所连接的三角个数阈值为λ的新图Gλ;(3.2)统计Tri(G)≥i的节点的个数,记为histi(Gλ);(3.3)通过对histi(Gλ)添加敏感度为2λ+1的噪声,记为TCλ(G),其中,表示加噪之后连接三角个数不大于i的节点个数;(3.4)发布加噪后的节点三角个数累积分布直方图TCλ(G)。5.根据权利要求2所述的方法,其特征...

【专利技术属性】
技术研发人员:金海丁晓锋张晓冬
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1