基于图神经网络的隐私特征保护方法和系统技术方案

技术编号：39423377 阅读：9 留言：0更新日期：2023-11-19 16:11

本发明专利技术公开了一种基于图神经网络的隐私特征保护方法和系统，属于用户隐私安全技术领域

全部详细技术资料下载

【技术实现步骤摘要】
基于图神经网络的隐私特征保护方法和系统

[0001]本专利技术涉及用户隐私安全
，尤其涉及一种基于图神经网络的隐私特征保护方法和系统
。

技术介绍

[0002]图数据中，由于存在用户信息及其用户之间的关系，如好友关系
、
关注关系
、
引用关系等，容易利用用户的依赖关系推测出用户的隐私特征，如性别，年龄等等
。
现有算法中，传统隐私特征保护方法所采用的建模方法难以防止敌手利用图中的拓扑结构针对隐私特征进行攻击
。
除此之外，虽有一些保护方法采用了对拓扑结构进行扰动的做法，但并没有从特征同质性和结构同质性同时考虑来切断隐私信息的泄漏，并且计算复杂度较高，导致性能和可应用性较差
。
[0003]特征同质性和结构同质性为图上的隐私特征推测带来了重要信息，而现有方法难以很好保护这种隐私泄漏，因此学术界和工业界往往在发布图数据时都面临着安全隐患，需要在发布之间进行数据脱敏
。
从微观角度分析，在一部分图数据中，节点的隐私特征具有特征同质性的分布模式，即有边相连或距离较近的两个节点往往具有同样隐私特征，如同一个地区的人更有可能成为好友；而在另一部分图数据中，隐私特征具有结构同质性的分布模式，即具有相同子结构特征的节点则更有可能具有相同的隐私特征，如年轻用户的好友网络较为密集，年长用户的好友网络较为稀疏
。
在常用的隐私特征推测方法中，敌手往往通过从一个目标节点周围的邻居或与其结构相似的节点中获取隐私信息，...

【技术保护点】

【技术特征摘要】
1.
一种基于图神经网络的隐私特征保护方法，其特征在于，包括：给定用户信息及其用户之间的关系，作为待脱敏数据；将待脱敏数据中的每一个给定用户视为网络拓扑结构中的一个节点，将用户信息作为节点特征，构建节点特征矩阵；根据待脱敏数据中用户之间的关系构建邻接矩阵，得到原始图数据；通过基于图神经网络的防守模型计算原始图数据中每条边的采样概率，根据采样概率对边进行采样，根据采样后的边更新邻接矩阵，得到扰动后的图数据；通过基于邻接性和结构相似性模式的敌手模型在扰动后的图数据上进行隐私特征分类预测；对所述的防守模型和敌手模型进行对抗训练，得到每条边的最终采样概率，根据最终采样概率对边进行采样，记录未采样的边；从待脱敏数据中删除未采样到的边对应的用户之间的关系，得到隐私特征保护后的数据
。2.
根据权利要求1所述的基于图神经网络的隐私特征保护方法，其特征在于，所述的通过基于图神经网络的防守模型对计算原始图数据中每条边的采样概率，根据采样概率对边进行采样，公式如下：
H
d
＝
f
d
(X,A)(X,A)
其中，
X
表示节点特征矩阵，
A
表示邻接矩阵，
f
d
(
·
)
表示图神经网络，
H
d
表示节点表征集合，表示矩阵拼接，
MLP
为多层感知机，
σ
为
sigmoid
函数，表示节点
i
的表征，表示图数据中边
(i,j)
的采样概率，
A
′
ij
表示节点
i、j
之间的边
(i,j)
的采样结果，
Gumbel
‑
Softmax
表示重参数化方法
。3.
根据权利要求1所述的基于图神经网络的隐私特征保护方法，其特征在于，所述的基于邻接性和结构相似性模式的敌手模型包括基于全图聚合的图神经网络和基于子图聚合的图神经网络，表示如下：的图神经网络，表示如下：的图神经网络，表示如下：其中，
f
p
(
·
)
表示基于全图聚合的图神经网络，
f
s
(
·
)
表示基于子图聚合的图神经网络，
X
表示节点特征矩阵，
A
′
表示更新后的邻接矩阵，表示邻接性模式下的隐私分类结果；
X
i
、A
i
分别表示节点
i
的2阶子图的特征矩阵和邻接矩阵，
X
′
i
表示节点
i
的2阶子图的特征矩阵与结构编码拼接后的结果，表示结构相似性模式下对节点
i
的隐私分类结果，
SE
i
表示在节点
i
的子图中进行随机游走得到的结构编码
。4.
根据权利要求3所述的基于图神经网络的隐私特征保护方法，其特征在于，所述的在扰动后的图数据上进行隐私特征分类预测，包括计算扰动后的图数据对应的特征同质性系数和结构同质性系数，并利用系数对隐私分类结果进行加权，得到节点的最终隐私分类结果，计算公式为：
其中，表示节点
i
的最终隐私分类结果，表示邻接性模式下对节点
i
的隐私分类结果，表示归一化后的节点
i
的隐私分类结果的特征同质性系数，表示归一化后的节点
i
的隐私分类结果的结构同质性系数
。5.
根据权利要求4所述的基于图神经网络的隐私特征保护方法，其特征在于，所述的特征同质性系数和结构同质性系数的计算公式为：征同质性系数和结构同质性系数的计算公式为：征同质性系数和结构同质性系数的计算公式为：征同质性系数和结构同质性系数的计算公式为：其中，
N(i)
表示节点
i
的1阶邻居，
D(i)
表示节点
i
的度数，表示节点
i、j
的隐私分类结果，
#{
...

【专利技术属性】
技术研发人员：苑瀚洋，杨洋，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人