一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质技术

技术编号:37985720 阅读:10 留言:0更新日期:2023-06-30 10:00
本发明专利技术公开了一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质,属于数据安全领域,解决了直接使用随机响应机制的图结构边密度膨胀,无法保留图上重要的社区特征,以及模型学习过程中的隐私泄露问题。该方法在用户和收集者之间设计了两轮交互,第一轮交互中,用户端使用个性化采样技术和随机响应机制扰动和其他用户间的链接关系并发送给收集者,收集者聚集所有用户发送的链接关系使用社区发现算法划分用户所属社区。第二轮交互中,用户端结合社区划分结果进行个性化采样随机响应然后发送扰动后的链接关系给收集者,收集者聚集所有用户发送的链接关系得到最终的图邻接矩阵。本发明专利技术适用于图隐私保护场景。本发明专利技术适用于图隐私保护场景。本发明专利技术适用于图隐私保护场景。

【技术实现步骤摘要】
一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质


[0001]本专利技术涉及数据安全领域,具体涉及去中心化社交网络下链接预测过程中的图结构隐私保护技术。

技术介绍

[0002]在现实生活中图数据是一种普遍存在的数据类型,例如社交网络和蛋白质网络。链接预测通过图上已知的图结构去推测节点间将来可能出现的连接关系,因此链接预测可以被社交网站用于新朋友推荐。然而,随着数据隐私越来越受到人们的重视,社交网站直接使用用户间真实的连接关系进行链接预测可能会泄露用户的敏感连接信息,因此用户可能就不愿意将自己与其他用户的连接关系分享给第三方。传统的在图上的隐私保护技术包括k

邻居算法,k

度匿名算法以及差分隐私(differential privacy,DP)。这些隐私保护技术首先假设存在一个可信的中心化平台,然后在这个中心化平台保留有所有用户的数据,平台就可以在用户数据上运行满足隐私保护要求的算法,则这个算法能输出满足隐私保护要求的结果,但是中心平台不总是可信的,它可能因为各种原因泄露用户的敏感数据,例如facebook曾泄露用户的隐私数据,同时平台本身可能也会窃取用户的敏感数据。除此之外,对一些去中心化的社交网络,每个用户拥有自己的一部分连接关系而没有一个中心化的平台保留所有用户间的连接关系,例如万维网,手机联系人网络,邮件联系人网络等,所以在以上这些场景中,用户需要一个去中心化的隐私保护技术。
[0003]本地差分隐私(local differential privacy,LDP)就是一种常用于保护去中心化用户敏感信息的隐私保护技术。LDP假设第三方平台是不可信的,所以LDP需要用户自己以满足LDP的方式扰动自己的数据,然后发送扰动后的数据给第三方平台。因为第三方平台接收到的是扰动后的数据而不是真实数据,所以用户的敏感信息不能直接被第三方平台获取,这样也就保护了用户的隐私。之前已经有一些在满足LDP条件下处理图数据的工作,这些工作可以分为两类,一类是图数据合成,一类是图上统计量的无偏估计。首先,针对LDP条件下的图数据合成,LDPGen是第一个在去中心化场景下满足LDP定义的合成图方法。这个方法中,作者基于Chung

Lu图生成模型通过精心设计的节点度收集策略去获得近似的图拓扑结构。随后CGGen方法进一步考虑节点间的组内相关性和组间相关性,然后基于节点间的相关性提出了一个合成图方法,该方法解决了可能通过局部图结构相关性泄露隐私的问题。之后PSG在收集度向量时更进一步考虑添加噪声的取值范围和生成图时的数据效用。其次,除了以上3个满足LDP条件下的图合成工作外还有一些工作关注于在LDP条件下估计图上的统计量。Sun在去中心化场景下提出了一个比edge

LDP隐私保护强度更高的差分隐私定义DDP,DDP定义为同时保护用户自己的连接隐私和邻居的连接隐私。在DDP条件下作者提出了一个估计图上统计量的多阶段框架。然后,Ye提出了LF

GDPR框架,LF

GDPR是一个满足edge

LDP的图上统计量的估计框架。LF

GDPR要求需要估计的统计量能被重写为邻接矩阵和节点的度之间的多项式的形式。Imola提出了一个估计三角计数和k

计数的方法,该方法
通过数据收集者与用户间的多轮交互去减少统计量的估计误差。总结现有的方法我们发现,现有的满足LDP的图合成方法能保留图上的整体性的结构特征,但是不能保留一些边级别的细粒度信息,而图上统计量的无偏估计关注于准确估计目标统计量,忽略了在扰动后的图结构中对原始图结构特征的保留。而现有的一些关于链接预测的工作指出,当我们采用启发式或者基于局部结构相似性计算目标连接出现概率的链接预测算法时,目标节点对的局部封闭子图中的图结构已经包含足够用于链接预测算法的特征。所以我们应该关注于保留更多的目标节点对局部子图所形成的局部图结构。而前面提到的方法都没有直接针对后续链接预测分析的特点进行优化,所以使用现有的方法扰动图数据都会导致后续的链接预测分析有着较差的表现。

技术实现思路

[0004]本专利技术目的是针对去中心化场景下的链接预测分析过程中的用户隐私保护问题,为了解决现有技术的不足,使用本地差分隐私技术,个性化采样技术,社区划分等技术,提出了一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法。
[0005]本专利技术是通过以下技术方案实现的,本专利技术提出一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法,所述方法具体包括以下步骤:
[0006]步骤1:数据收集者选择一个现有的没有考虑隐私保护的链接预测算法。数据收集者初始化图结构扰动相关的参数并将第一轮交互和第二轮交互需要的相关参数发送给每个用户。
[0007]步骤2:用户根据接收到的参数使用个性化采样随机响应算法扰动本地图结构并发送给数据收集者。
[0008]步骤3:数据收集者根据接收到的图结构使用社区发现算法得到社区发现结果并将社区划分结果再发送给每个用户。
[0009]步骤4:用户根据收到的社区划分使用基于社区的个性化采样随机响应算法扰动本地图结构并发送给数据收集者。
[0010]步骤5:数据收集者根据接收到的图结构和任意一个无隐私保护的链接预测算法训练一个满足本地差分隐私的链接预测模型。
[0011]进一步地,所述步骤1包括以下步骤:
[0012]步骤1.1:数据收集者设置总的隐私预算参数ε,收集到的图中的真实边占比的期望r,用于第一轮用户数据扰动的隐私预算分配系数α,以及社交网络中的总的用户数n;
[0013]步骤1.2:数据收集者分别计算用于第一轮交互和第二轮交互需要消耗的隐私预算ε1和ε2。然后将ε1,ε2,n和r发送给每个用户。
[0014]进一步地,所述步骤2包括以下步骤:
[0015]步骤2.1:用户将自己与其他用户之间的连接关系构建为一个n维的用户比特向量;
[0016]步骤2.2:用户根据所述ε1和r,使用所述个性化采样随机响应算法扰动用户比特向量,之后将扰动后的用户比特子集中比特值为1的比特对应的比特索引发送给数据收集
者。进一步地,所述步骤3包括以下步骤:
[0017]步骤3.1:数据收集者接收每个用户发送的用户比特向量中的比特值为1的比特索引,然后根据所有用户发送的比特索引在邻接矩阵对应位置填充1,其余位置填充0从而构建用户邻接矩阵;
[0018]步骤3.2:数据收集者在用户邻接矩阵上运行社区发现算法获得社区发现结果,之后将所述社区发现结果发送给每个用户。
[0019]进一步地,所述步骤4包括以下步骤:
[0020]用户根据接收到的社区发现结果和第二轮交互消耗的隐私预算ε2,使用基于社区的个性化采样随机响应方法扰动用户比特向量的子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法,其特征在于,所述方法具体包括以下步骤:步骤1:数据收集者初始化图结构扰动相关的参数并将第一轮交互和第二轮交互需要的相关参数发送给每个用户;步骤2:用户根据接收到的参数使用个性化采样随机响应算法扰动本地图结构并发送给数据收集者;步骤3:数据收集者根据接收到的本地图结构使用社区发现算法得到社区发现结果并将社区发现结果再发送给每个用户;步骤4:用户根据收到的社区划分结果使用基于社区的个性化采样随机响应算法扰动本地图结构并发送给数据收集者;步骤5:数据收集者根据接收到的图结构和任意一个无隐私保护的链接预测算法训练一个满足本地差分隐私的链接预测模型。2.根据权利要求1所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法,其特征在于,所述步骤1还包括以下步骤:步骤1.1:数据收集者设置总的隐私预算参数ε,收集到的图中的真实边占比的期望r,用于第一轮用户数据发送的隐私预算分配系数α,以及社交网络中的总的用户数n;步骤1.2:数据收集者分别计算用于第一轮交互需要消耗的隐私预算ε1和和第二轮交互需要消耗的ε2,然后将ε1,ε2,n和r发送给每个用户。3.根据权利要求2所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法,其特征在于,所述步骤2包括以下步骤:步骤2.1:用户将自己与其他用户之间的连接关系构建为一个n维的用户比特向量;步骤2.2:用户根据所述ε1和r,使用所述个性化采样随机响应算法扰动用户比特向量,之后将扰动后的用户比特子集中比特值为1的比特对应的比特索引发送给数据收集者。4.根据权利要求3所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法,其特征在于,所述步骤3...

【专利技术属性】
技术研发人员:韩启龙蒋林宇宋洪涛卢丹刘鹏
申请(专利权)人:哈尔滨龙明科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1