图嵌入处理方法技术

技术编号:39756109 阅读:11 留言:0更新日期:2023-12-17 23:55
本申请提供一种图嵌入处理方法

【技术实现步骤摘要】
图嵌入处理方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种图嵌入处理方法

装置

设备及存储介质


技术介绍

[0002]图是一种重要的数据表示形式,用于描述和建模复杂系统的通用语言

有效的图分析可以充分利用隐藏在图结构和节点中的信息进行定量解释,并在预测与决策等下游任务中得到广泛应用

图嵌入是解决图分析问题的一种有效方法

该方法将图的拓扑结构

节点信息和其他边内容高效地转化成低维连续的向量空间

[0003]现有技术中,基于
GNN(Graph Neural Network
,图神经网络
)
的图嵌入方法,通过在图中的节点和边上制定一定的策略,达到将图结构数据转化为规范表示的目的,接着可以将结果输入到多种不同的神经网络中进行训练,以适应各种任务的需要

[0004]然而,基于
GNN
的图嵌入方法由于受输入矩阵的影响而导致模型的稳健性低,造成生成的图嵌入向量质量不佳


技术实现思路

[0005]本申请提供一种图嵌入处理方法

装置

设备及存储介质,用以解决生成的图嵌入向量质量不佳的技术问题

[0006]第一方面,本申请提供一种图嵌入处理方法,包括:
[0007]获取待处理的图信息;/>[0008]对图信息进行数据预处理,得到预处理的图信息,其中预处理的图信息包括节点特征矩阵和邻接矩阵;
[0009]将节点特征矩阵和邻接矩阵输入预训练的生成器,得到图嵌入向量;
[0010]将图嵌入向量输入预训练的鉴别器,以输出悲观梯度;其中悲观梯度用来指示预训练的生成器的参数

[0011]可选地,如上所述的方法,对图信息进行数据预处理,得到预处理的图信息,包括:计算所有节点特征的数据缺失率;将数据缺失率小于预设值的节点特征确定为保留特征;判断任一保留特征是否存在空值;若任一保留特征存在空值,则判断空值的类型是否为字符型,若为字符型,则将空值填充为任一保留特征的众数;若不为字符型,则将空值填充为任一保留特征的均值;对各填充后的保留特征进行归一化处理,得到各归一化的节点特征;根据各归一化的节点特征,确定节点特征矩阵;根据各归一化的节点特征之间的边特征,确定邻接矩阵

[0012]可选地,如上所述的方法,图嵌入模型的训练方法,包括:建立初始的生成器,并对初始的生成器进行迭代训练,以得到预训练的生成器;建立初始的鉴别器,并对初始的鉴别器进行迭代训练,以得到预训练的鉴别器

[0013]可选地,如上所述的方法,初始的鉴别器包括鉴别器参数;相应地,对初始的鉴别
器进行迭代训练,以得到预训练的鉴别器,包括:将节点特征矩阵和邻接矩阵输入初始的生成器,生成图嵌入向量;将预设数量的图嵌入向量,输入初始的鉴别器,得到第一鉴别结果;将预设数量的随机向量,输入初始的鉴别器,得到第二鉴别结果;其中随机向量是来自先验分布的采样的向量;根据第一鉴别结果

第二鉴别结果和鉴别器损失函数,对初始的鉴别器进行迭代训练,得到更新后的鉴别器参数;将更新后的鉴别器参数应用到初始的鉴别器,得到预训练的鉴别器

[0014]可选地,如上所述的方法,鉴别器损失函数,为:
[0015][0016]式中,为鉴别器的损失值;
h
为批处理的值;
z
i

为来自先验分布的采样的向量的第
i
个值;
z
i
为图嵌入向量的第
i
个值

[0017]可选地,如上所述的方法,初始的生成器包括生成器参数;相应地,对初始的生成器进行迭代训练,以得到预训练的生成器,包括:根据公式一获取悲观输入;根据第一生成器损失函数,对初始的生成器进行迭代训练,得到更新后的生成器参数,其中第一生成器损失函数是由重构损失函数和悲观损失函数的差值得到的;将更新后的生成器参数应用到初始的生成器,得到预训练的生成器

[0018]可选地,如上所述的方法,公式一为:
[0019][0020]Z
(1)

f
Relu
(X,A|W
(0)
)
[0021]Z

f
linear
(Z
(1)
,A|W
(1)
)
[0022]式中,
Z
pess
为悲观输入;
W
(0)
为第1次卷积时的训练参数,
W
(1)
为第2次卷积时的训练参数,
A
为邻接矩阵;
Z
(1)
为第1次图卷积后的嵌入向量,采用
Relu
激活函数计算得到;
Z
为图嵌入向量,采用线性激活函数进行输出;
α
为悲观度,其取值范围为
[0,1];为图嵌入向量
Z
通过预训练的鉴别器得到的损失函数关于输入
Z
的梯度

[0023]第一生成器损失函数为:
[0024]L
G1

L
rec

L
pess
[0025][0026][0027][0028]式中,
L
G1
为第一生成器损失值,
L
rec
为重构损失值,
L
pess
为悲观损失值;为重构矩阵;
A
i,j
为邻接矩阵的第
i

j
列的值;是重构矩阵的第
i

j
列的值;
Z
pess
为悲观输入

[0029]可选地,如上所述的方法,对初始的生成器进行迭代训练,以得到预训练的生成器,还包括:根据公式二获取悲观输入;根据第二生成器损失函数,对初始的生成器进行迭代训练,得到更新后的生成器参数,其中第二生成器损失函数是由重构损失函数

悲观损失函数和散度损失函数计算得到的;将更新后的生成器参数应用到初始的生成器,得到预训
练的生成器

[0030]可选地,如上所述的方法,公式二为:
[0031][0032][0033]式中,
Z
pess
为悲观输入;
Z
为图嵌入向量,符合高斯先验分布;
α
为悲观度,其取值范围为
[0,1];为图嵌入向量
Z
通过预训练的鉴本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种图嵌入处理方法,其特征在于,所述方法应用于部署有图嵌入模型的计算机设备,所述图嵌入模型包括预训练的生成器和预训练的鉴别器;所述方法包括:获取待处理的图信息;对所述图信息进行数据预处理,得到预处理的图信息,其中所述预处理的图信息包括节点特征矩阵和邻接矩阵;将所述节点特征矩阵和邻接矩阵输入所述预训练的生成器,得到图嵌入向量;将所述图嵌入向量输入所述预训练的鉴别器,以输出悲观梯度;其中所述悲观梯度用来指示所述预训练的生成器的参数
。2.
根据权利要求1所述的方法,其特征在于,所述图信息包括所有节点特征和所有边特征;相应地,所述对所述图信息进行数据预处理,得到预处理的图信息,包括:计算所述所有节点特征的数据缺失率;将所述数据缺失率小于预设值的节点特征确定为保留特征;判断任一保留特征是否存在空值;若所述任一保留特征存在空值,则判断所述空值的类型是否为字符型,若为字符型,则将所述空值填充为所述任一保留特征的众数;若不为字符型,则将所述空值填充为所述任一保留特征的均值;对各填充后的保留特征进行归一化处理,得到各归一化的节点特征;根据所述各归一化的节点特征,确定所述节点特征矩阵;根据所述各归一化的节点特征之间的边特征,确定所述邻接矩阵
。3.
根据权利要求1或2所述的方法,其特征在于,所述图嵌入模型的训练方法,包括:建立初始的生成器,并对所述初始的生成器进行迭代训练,以得到所述预训练的生成器;建立初始的鉴别器,并对所述初始的鉴别器进行迭代训练,以得到所述预训练的鉴别器
。4.
根据权利要求3所述的方法,其特征在于,所述初始的鉴别器包括鉴别器参数;相应地,所述对所述初始的鉴别器进行迭代训练,以得到所述预训练的鉴别器,包括:将所述节点特征矩阵和所述邻接矩阵输入所述初始的生成器,生成图嵌入向量;将预设数量的图嵌入向量,输入初始的鉴别器,得到第一鉴别结果;将预设数量的随机向量,输入初始的鉴别器,得到第二鉴别结果;其中所述随机向量是来自先验分布的采样的向量;根据所述第一鉴别结果

所述第二鉴别结果和鉴别器损失函数,对所述初始的鉴别器进行迭代训练,得到更新后的鉴别器参数;将所述更新后的鉴别器参数应用到所述初始的鉴别器,得到所述预训练的鉴别器
。5.
根据权利要求4所述的方法,其特征在于,所述鉴别器损失函数,为:
式中,为所述鉴别器的损失值;
h
为批处理的值;
z
i

为来自先验分布的采样的向量的第
i
个值;
z
i
为所述图嵌入向量的第
i
个值
。6.
根据权利要求3所述的方法,其特征在于,所述初始的生成器包括生成器参数;相应地,所述对所述初始的生成器进行迭代训练,以得到所述预训练的生成器,包括:根据公式一获取悲观输入;根据第一生成器损失函数,对所述初始的生成器进行迭代训练,得到更新后的生成器参数,其中第一生成器损失函数是由重构损失函数和悲观损失函数的差值得到的;将所述更新后的生成器参数应用到所述初始的生成器,得到所述预训练的生成器
。7.
根据权利要求6所述的方法,其特征在于,所述公式一为:
Z
(1)

fRelu(X,A|W
(0)
)Z

f
linear
(Z
(1)
,A|W
(1)
)
式中,
Z
pess
为悲观输入;
W
(0)
为第1次卷积时的训练参数,
W
(1)
为第2次卷积时的训练参数,
A
为所述邻接矩阵;
Z
(1)
为第1次图卷积后的嵌入向量,采用
Relu
激活函数计算得到;
Z
为所述图嵌入向量,采用线性激活函数进行输出;
α
为悲观度,其取值范围为
[0,1]
;为所述图嵌入向量
...

【专利技术属性】
技术研发人员:宋英豪王功举冯翰斌李阳闫龙胡博文李大中
申请(专利权)人:联通数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1