【技术实现步骤摘要】
一种基于差分隐私的地理分布式图计算方法及系统
本专利技术涉及大规模图分割处理领域,具体涉及一种基于差分隐私的地理分布式图计算方法及系统。
技术介绍
在地理分布式的数据中心(DC:DataCenter)上进行图处理时,为了保护个人隐私,可以应用差分隐私技术。差分隐私是一种经过严格证明的能够保护个人隐私的差分技术,它通过在不同DC之间的通信上加随机噪音(noise)的方法来实现差分隐私。这个随机的noise的大小主要是由两个参数决定的,一是隐私预算(budget),一是敏感度(sensitivity)。budget的大小与隐私保护效果、noise的大小之间的关系是这样的:budget越大,所加入的noise越小,保护效果越差;budget越小,加入的noise越大,保护效果越好。这里所说的budget是指总的budget大小,对于计算过程具有迭代特征的应用(PageRank、sssp等),还需要把这个budget按照某种规则分配给每个迭代过程,然后在具体的每次迭代中再细分给各个顶点。现有技术存在的主要问题有两个:1、对于具有迭代 ...
【技术保护点】
1.一种基于差分隐私的地理分布式图计算方法,其特征在于,包括如下步骤:/n基于差分隐私利用预设处理模型对地理分布图进行图计算,按照指数分配机制对地理分布图中每一轮迭代分配预算;/n在数据中心中增加聚合器来收集需要发送向相邻数据中心的数据,并将其全部加起来加上本轮迭代对应的噪音,再平均划分后发送给相邻的数据中心;/n各数据中心接收上一轮迭代后其他数据中心发送的数据,并更新顶点的有效值,并重复所述在数据中心中增加聚合器来收集需要发送向相邻数据中心的数据,并将其全部加起来加上本轮迭代对应的噪音,再平均划分后发送给相邻的数据中心的步骤,直至达到预设收敛条件,迭代结束;各个数据中心按 ...
【技术特征摘要】
1.一种基于差分隐私的地理分布式图计算方法,其特征在于,包括如下步骤:
基于差分隐私利用预设处理模型对地理分布图进行图计算,按照指数分配机制对地理分布图中每一轮迭代分配预算;
在数据中心中增加聚合器来收集需要发送向相邻数据中心的数据,并将其全部加起来加上本轮迭代对应的噪音,再平均划分后发送给相邻的数据中心;
各数据中心接收上一轮迭代后其他数据中心发送的数据,并更新顶点的有效值,并重复所述在数据中心中增加聚合器来收集需要发送向相邻数据中心的数据,并将其全部加起来加上本轮迭代对应的噪音,再平均划分后发送给相邻的数据中心的步骤,直至达到预设收敛条件,迭代结束;各个数据中心按照达到预设收敛条件的处理模型,进行地理分布式图之间的数据传输。
2.根据权利要求1所述的基于差分隐私的地理分布式图计算方法,其特征在于,在数据中心中增加聚合器来收集需要发送向其他数据中心的消息的步骤之前,还包括:
在某轮迭代中丢弃所有顶点,按照预设重新采样公式得到的概率对所有顶点进行重取样之后,取样成功的顶点将会分配给其应归属的聚合器。
3.根据权利要求2所述的基于差分隐私的地理分布式图计算方法,其特征在于,各个顶点有效值的获取方式包括:最短单源路径算法或PageRank算法;当通过最短单源路径算法获取时,各个顶点的有效值为最短路径长度;当通过PageRank算法获取时,各个顶点的有效值为rank值。
4.根据权利要求3所述的基于差分隐私的地理分布式图计算方法,其特征在于,重取样概率公式为:
式中,rank代表本轮迭代中某个顶点的有效值;
n表征顶点的初始有效值。
5.根据权利要求1所述的基于差分隐私的地理分布式图计算方法,其特征在于,所述预设迭代条件包括:本轮迭代中各个数据中心有效值的平均值达到预设值、迭代次数等于预设最大迭代次数或本轮迭代中各个顶点有效值相对于上轮的有效值的变化值均小于预设值,中的至少之一种。
6.根据权利要求5所述的基于差分隐私的地理分布式图计算方法,其特征在于,预设指数分配机制...
【专利技术属性】
技术研发人员:周池,邱锐波,张嘉睿,毛睿,
申请(专利权)人:深圳大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。