一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质技术

技术编号：37985720 阅读：10 留言：0更新日期：2023-06-30 10:00

本发明专利技术公开了一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质，属于数据安全领域，解决了直接使用随机响应机制的图结构边密度膨胀，无法保留图上重要的社区特征，以及模型学习过程中的隐私泄露问题。该方法在用户和收集者之间设计了两轮交互，第一轮交互中，用户端使用个性化采样技术和随机响应机制扰动和其他用户间的链接关系并发送给收集者，收集者聚集所有用户发送的链接关系使用社区发现算法划分用户所属社区。第二轮交互中，用户端结合社区划分结果进行个性化采样随机响应然后发送扰动后的链接关系给收集者，收集者聚集所有用户发送的链接关系得到最终的图邻接矩阵。本发明专利技术适用于图隐私保护场景。本发明专利技术适用于图隐私保护场景。本发明专利技术适用于图隐私保护场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法、设备及介质

[0001]本专利技术涉及数据安全领域，具体涉及去中心化社交网络下链接预测过程中的图结构隐私保护技术。

技术介绍

[0002]在现实生活中图数据是一种普遍存在的数据类型，例如社交网络和蛋白质网络。链接预测通过图上已知的图结构去推测节点间将来可能出现的连接关系，因此链接预测可以被社交网站用于新朋友推荐。然而，随着数据隐私越来越受到人们的重视，社交网站直接使用用户间真实的连接关系进行链接预测可能会泄露用户的敏感连接信息，因此用户可能就不愿意将自己与其他用户的连接关系分享给第三方。传统的在图上的隐私保护技术包括k
‑
邻居算法，k
‑
度匿名算法以及差分隐私(differential privacy,DP)。这些隐私保护技术首先假设存在一个可信的中心化平台，然后在这个中心化平台保留有所有用户的数据，平台就可以在用户数据上运行满足隐私保护要求的算法，则这个算法能输出满足隐私保护要求的结果，但是中心平台不总是可信的，它可能因为各种原因泄露用户的敏感数据，例如facebook曾泄露用户的隐私数据，同时平台本身可能也会窃取用户的敏感数据。除此之外，对一些去中心化的社交网络，每个用户拥有自己的一部分连接关系而没有一个中心化的平台保留所有用户间的连接关系，例如万维网，手机联系人网络，邮件联系人网络等，所以在以上这些场景中，用户需要一个去中心化的隐私保护技术。
[0003]本地差分隐私(local di...

【技术保护点】

【技术特征摘要】
1.一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法，其特征在于，所述方法具体包括以下步骤：步骤1：数据收集者初始化图结构扰动相关的参数并将第一轮交互和第二轮交互需要的相关参数发送给每个用户；步骤2：用户根据接收到的参数使用个性化采样随机响应算法扰动本地图结构并发送给数据收集者；步骤3：数据收集者根据接收到的本地图结构使用社区发现算法得到社区发现结果并将社区发现结果再发送给每个用户；步骤4：用户根据收到的社区划分结果使用基于社区的个性化采样随机响应算法扰动本地图结构并发送给数据收集者；步骤5：数据收集者根据接收到的图结构和任意一个无隐私保护的链接预测算法训练一个满足本地差分隐私的链接预测模型。2.根据权利要求1所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法，其特征在于，所述步骤1还包括以下步骤：步骤1.1：数据收集者设置总的隐私预算参数ε，收集到的图中的真实边占比的期望r，用于第一轮用户数据发送的隐私预算分配系数α，以及社交网络中的总的用户数n；步骤1.2：数据收集者分别计算用于第一轮交互需要消耗的隐私预算ε1和和第二轮交互需要消耗的ε2，然后将ε1,ε2,n和r发送给每个用户。3.根据权利要求2所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法，其特征在于，所述步骤2包括以下步骤：步骤2.1：用户将自己与其他用户之间的连接关系构建为一个n维的用户比特向量；步骤2.2：用户根据所述ε1和r，使用所述个性化采样随机响应算法扰动用户比特向量，之后将扰动后的用户比特子集中比特值为1的比特对应的比特索引发送给数据收集者。4.根据权利要求3所述的一种基于个性化采样随机响应图结构扰动算法的满足本地差分隐私的链接预测模型的构建方法，其特征在于，所述步骤3...

【专利技术属性】
技术研发人员：韩启龙，蒋林宇，宋洪涛，卢丹，刘鹏，
申请(专利权)人：哈尔滨龙明科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人