当前位置: 首页 > 专利查询>浙江大学专利>正文

基于图神经网络的隐私特征保护方法和系统技术方案

技术编号:39423377 阅读:9 留言:0更新日期:2023-11-19 16:11
本发明专利技术公开了一种基于图神经网络的隐私特征保护方法和系统,属于用户隐私安全技术领域

【技术实现步骤摘要】
基于图神经网络的隐私特征保护方法和系统


[0001]本专利技术涉及用户隐私安全
,尤其涉及一种基于图神经网络的隐私特征保护方法和系统


技术介绍

[0002]图数据中,由于存在用户信息及其用户之间的关系,如好友关系

关注关系

引用关系等,容易利用用户的依赖关系推测出用户的隐私特征,如性别,年龄等等

现有算法中,传统隐私特征保护方法所采用的建模方法难以防止敌手利用图中的拓扑结构针对隐私特征进行攻击

除此之外,虽有一些保护方法采用了对拓扑结构进行扰动的做法,但并没有从特征同质性和结构同质性同时考虑来切断隐私信息的泄漏,并且计算复杂度较高,导致性能和可应用性较差

[0003]特征同质性和结构同质性为图上的隐私特征推测带来了重要信息,而现有方法难以很好保护这种隐私泄漏,因此学术界和工业界往往在发布图数据时都面临着安全隐患,需要在发布之间进行数据脱敏

从微观角度分析,在一部分图数据中,节点的隐私特征具有特征同质性的分布模式,即有边相连或距离较近的两个节点往往具有同样隐私特征,如同一个地区的人更有可能成为好友;而在另一部分图数据中,隐私特征具有结构同质性的分布模式,即具有相同子结构特征的节点则更有可能具有相同的隐私特征,如年轻用户的好友网络较为密集,年长用户的好友网络较为稀疏

在常用的隐私特征推测方法中,敌手往往通过从一个目标节点周围的邻居或与其结构相似的节点中获取隐私信息,从而更精确地推测出目标及节点的隐私特征

[0004]其次,从宏观角度分析,给定需要保护的隐私特征,现有方法也难以同时从特征同质性和结构同质性分析隐私泄漏的模式

一方面,现有方法虽然提出了衡量邻接性的分布模式强弱的方法,但仍然缺乏对节点隐私特征和其结构特征相关性的定量分析方法,这导致现有的保护方法难以捕捉局部结构特征对隐私泄漏的影响

另一方面,由于网络中不同节点具有不同的分布模式,实际中也难以去很好地处理这种同时存在的分布混合模式

因此,如何通过扰动拓扑结构来切断隐私泄漏,对待发布的用户信息及其用户之间的关系数据进行脱敏,在保留全部用户信息的同时不造成用户隐私特征的泄露,仍然是一个有研究价值的重要问题


技术实现思路

[0005]为了解决现有技术的隐私特征保护方法性能较低

可应用性较差的问题,本专利技术提出了一种基于图神经网络的隐私特征保护方法和系统,用于实现对用户隐私特征进行有效保护

[0006]本专利技术采用如下技术方案:
[0007]第一个方面,本专利技术提供了一种基于图神经网络的隐私特征保护方法,包括:
[0008]给定用户信息及其用户之间的关系,作为待脱敏数据;
[0009]将待脱敏数据中的每一个给定用户视为网络拓扑结构中的一个节点,将用户信息作为节点特征,构建节点特征矩阵;根据待脱敏数据中用户之间的关系构建邻接矩阵,得到原始图数据;通过基于图神经网络的防守模型计算原始图数据中每条边的采样概率,根据采样概率对边进行采样,根据采样后的边更新邻接矩阵,得到扰动后的图数据;
[0010]通过基于邻接性和结构相似性模式的敌手模型在扰动后的图数据上进行隐私特征分类预测;
[0011]对所述的防守模型和敌手模型进行对抗训练,得到每条边的最终采样概率,根据最终采样概率对边进行采样,记录未采样的边;从待脱敏数据中删除未采样到的边对应的用户之间的关系,得到隐私特征保护后的数据

[0012]第二个方面,本专利技术提供了一种基于图神经网络的隐私特征保护系统,用于实现上述的基于图神经网络的隐私特征保护方法

[0013]与现有技术相比,本专利技术的具备的有益效果是:本专利技术基于给定用户信息及其用户之间的关系建立图数据,通过切断图中节点之间的边,保留节点特征不变,对原始图数据的拓扑结构进行扰动,实现对图数据中用户的隐私特征进行有效保护

附图说明
[0014]图1是根据一示例性实施例示出的基于图神经网络的隐私特征保护示意图;
[0015]图2是根据一示例性实施例示出的基于特征同质性和结构同质性的敌手模型示意图

具体实施方式
[0016]下面结合附图和实施例对本专利技术进行进一步说明

附图仅为本专利技术的示意性图解,附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和
/
或处理器装置和
/
或微控制器装置中实现这些功能实体

[0017]本专利技术的目标,是基于给定用户信息及其用户之间的关系构建图数据,通过对图数据的拓扑结构进行扰动,对用户的隐私特征
(
例如性别

年龄段
)
进行有效保护

具体地,本专利技术设计端到端的图神经网络进行图节点隐私特征保护

本专利技术中,基于图神经网络的用户隐私特征保护方法是利用对抗训练,使得基于特征同质性和结构同质性的敌手模型性能下降,同时尽可能减少扰动比例的图神经网络的深度框架,主要包含两个部分:基于图神经网络的防守模型

基于特征同质性和结构同质性的敌手模型

[0018]图1所示为本专利技术的总体框架,模型的输入是由待脱敏数据构建的原始图数据,其包括完整的拓扑结构

用户特征
(
节点特征
)、
以及用户的真实隐私特征,隐私特征可以是如性别
(
男性

女性
)
或年龄段
(
青年

老年
)


[0019]本专利技术中,部分图数据中节点的隐私特征具有特征同质性的分布模式,另一部分图数据中则具有结构同质性的分布模式

因此,本专利技术利用基于特征同质性和结构同质性的敌手模型来作为对抗训练中最坏情况下
(Worst case)
的敌手

敌手模型图神经网络以及特征同质性和结构同质性系数来实现对图数据中隐私特征的推测

[0020]首先,每一个给定用户视为网络拓扑结构中的一个节点,从给定用户信息中得到
节点特征矩阵,将该节点特征矩阵作为图中节点的原始输入,并通过给定用户之间的关系构建邻接矩阵,得到原始图数据

通过基于图神经网络的防守模型对图数据的边进行采样,扰动图数据的拓扑结构,再使用基于特征同质性和结构同质性的敌手模型在扰动后的图数据上进行隐私预测

敌手模型在扰动后的全图数据中和在扰动后的由每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于图神经网络的隐私特征保护方法,其特征在于,包括:给定用户信息及其用户之间的关系,作为待脱敏数据;将待脱敏数据中的每一个给定用户视为网络拓扑结构中的一个节点,将用户信息作为节点特征,构建节点特征矩阵;根据待脱敏数据中用户之间的关系构建邻接矩阵,得到原始图数据;通过基于图神经网络的防守模型计算原始图数据中每条边的采样概率,根据采样概率对边进行采样,根据采样后的边更新邻接矩阵,得到扰动后的图数据;通过基于邻接性和结构相似性模式的敌手模型在扰动后的图数据上进行隐私特征分类预测;对所述的防守模型和敌手模型进行对抗训练,得到每条边的最终采样概率,根据最终采样概率对边进行采样,记录未采样的边;从待脱敏数据中删除未采样到的边对应的用户之间的关系,得到隐私特征保护后的数据
。2.
根据权利要求1所述的基于图神经网络的隐私特征保护方法,其特征在于,所述的通过基于图神经网络的防守模型对计算原始图数据中每条边的采样概率,根据采样概率对边进行采样,公式如下:
H
d

f
d
(X,A)(X,A)
其中,
X
表示节点特征矩阵,
A
表示邻接矩阵,
f
d
(
·
)
表示图神经网络,
H
d
表示节点表征集合,表示矩阵拼接,
MLP
为多层感知机,
σ

sigmoid
函数,表示节点
i
的表征,表示图数据中边
(i,j)
的采样概率,
A

ij
表示节点
i、j
之间的边
(i,j)
的采样结果,
Gumbel

Softmax
表示重参数化方法
。3.
根据权利要求1所述的基于图神经网络的隐私特征保护方法,其特征在于,所述的基于邻接性和结构相似性模式的敌手模型包括基于全图聚合的图神经网络和基于子图聚合的图神经网络,表示如下:的图神经网络,表示如下:的图神经网络,表示如下:其中,
f
p
(
·
)
表示基于全图聚合的图神经网络,
f
s
(
·
)
表示基于子图聚合的图神经网络,
X
表示节点特征矩阵,
A

表示更新后的邻接矩阵,表示邻接性模式下的隐私分类结果;
X
i
、A
i
分别表示节点
i
的2阶子图的特征矩阵和邻接矩阵,
X

i
表示节点
i
的2阶子图的特征矩阵与结构编码拼接后的结果,表示结构相似性模式下对节点
i
的隐私分类结果,
SE
i
表示在节点
i
的子图中进行随机游走得到的结构编码
。4.
根据权利要求3所述的基于图神经网络的隐私特征保护方法,其特征在于,所述的在扰动后的图数据上进行隐私特征分类预测,包括计算扰动后的图数据对应的特征同质性系数和结构同质性系数,并利用系数对隐私分类结果进行加权,得到节点的最终隐私分类结果,计算公式为:
其中,表示节点
i
的最终隐私分类结果,表示邻接性模式下对节点
i
的隐私分类结果,表示归一化后的节点
i
的隐私分类结果的特征同质性系数,表示归一化后的节点
i
的隐私分类结果的结构同质性系数
。5.
根据权利要求4所述的基于图神经网络的隐私特征保护方法,其特征在于,所述的特征同质性系数和结构同质性系数的计算公式为:征同质性系数和结构同质性系数的计算公式为:征同质性系数和结构同质性系数的计算公式为:征同质性系数和结构同质性系数的计算公式为:其中,
N(i)
表示节点
i
的1阶邻居,
D(i)
表示节点
i
的度数,表示节点
i、j
的隐私分类结果,
#{
...

【专利技术属性】
技术研发人员:苑瀚洋杨洋
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1