【技术实现步骤摘要】
图嵌入处理方法、装置、计算机设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种图嵌入处理方法
、
装置
、
计算机设备及存储介质
。
技术介绍
[0002]图在计算机中是一种由节点和边组成的数据结构,常用于表示元素之间的关系,目前节点分类
、
节点聚类
、
社区检测等问题可以通过图分析进行解决
。
图嵌入是一种高效的图处理的方法,该方法将图的拓扑结构
、
节点信息和其他内容映射到低维连续的图嵌入向量,能够为后续下游任务进行图处理时提高速度与准确度
。
[0003]现有技术中,图嵌入处理过程,通过在图神经网络
(Graph Neural Network
,
GNN)
的基础上扩展出了图自编码器
(Graph Auto Encoders
,
GAEs)
,
GAEs
使用图卷积网络作为编码器,通过
GAEs
的编码处理输出图嵌入空间向量
。
[0004]然而,现有的图神经网络中图自编码器的处理效果不佳,使得输出的图嵌入空间向量与原始的图信息差异较大,图嵌入的处理效果较差
。
技术实现思路
[0005]本申请提供一种图嵌入处理方法
、
装置
、
计算机设备及存储介质,用以解决图嵌入的处理效果较差的技术问题
。 >[0006]第一方面,本申请提供一种图嵌入处理方法,包括:
[0007]获取待处理的图信息,并获取图信息中的所有节点特征和所有边特征
。
根据所有节点特征确定特征矩阵
。
根据所有边特征确定邻接矩阵
。
将邻接矩阵和特征矩阵输入预训练的图卷积编码器,以得到图信息对应的图嵌入向量
。
将图嵌入向量和特征矩阵输入预训练的互信息判别器,以得到图信息对应的互信息判别结果,其中互信息判别结果用于指示预训练的图卷积编码器处理前后的图嵌入向量和图信息的特征矩阵的信息关联度,其中信息关联度用于指示预训练的图卷积编码器的图嵌入处理效果并确定是否需要继续训练图卷积编码器
。
[0008]可选地,如上的方法,图嵌入模型还包括负样本生成器模块,其中负样本生成器模块包括预训练的负样本生成器和预训练的负样本判别器
。
相应地,图嵌入模型的训练过程,包括:建立初始的图卷积编码器,并对初始的图卷积编码器进行迭代训练,以得到预训练的图卷积编码器
。
建立初始的互信息判别器,并对初始的互信息判别器进行迭代训练,以得到预训练的互信息判别器
。
建立初始的负样本生成器,并对初始的负样本生成器进行迭代训练,以得到预训练的负样本生成器
。
建立初始的负样本判别器,并对初始的负样本判别器进行迭代训练,以得到预训练的负样本判别器
。
[0009]可选地,如上所述的方法,建立初始的图卷积编码器,并对初始的图卷积编码器进行迭代训练,以得到预训练的图卷积编码器,包括:建立初始的图卷积编码器,其中初始的图卷积编码器包括编码器参数
。
获取预设数量的训练样本图信息
。
根据预设数量的训练样
本图信息以及自编码器损失函数,对初始的图卷积编码器进行迭代训练,得到更新后的编码器参数;其中,自编码器损失函数由重构损失函数和互信息判别器的损失函数相加得到
。
将更新后的编码器参数应用到初始的图卷积编码器,得到预训练的图卷积编码器
。
[0010]可选地,如上所述的方法,重构损失函数为:
[0011][0012][0013]式中,
L
REC
是重构损失值;
Z
为图嵌入向量;为重构矩阵;
A
i,j
是邻接矩阵的第
i
行
j
列的值;是重构矩阵的第
i
行
j
列的值;
[0014]互信息判别器的损失函数为:
[0015][0016]式中,是互信息判别器的损失函数值;
A
为邻接矩阵;
X
为特征矩阵;
E(A,X)
是邻接矩阵和特征矩阵通过预训练的图卷积编码器计算得到的结果;
D
MI
(E(A,X))
是预训练的图卷积编码器计算的结果通过预训练的互信息判别器得到的值
。
[0017]可选地,如上所述的方法,建立初始的互信息判别器,并对初始的互信息判别器进行迭代训练,以得到预训练的互信息判别器,包括:建立初始的互信息判别器,其中初始的互信息判别器包括互信息判别器参数
。
获取特征数据和图嵌入向量的互信息结果作为正样本
。
获取产生于预训练的负样本生成器的生成的节点特征矩阵和生成的图嵌入向量的互信息结果作为负样本
。
根据正样本
、
负样本以及互信息判别器的损失函数,对初始的互信息判别器进行迭代训练,得到更新后的互信息判别器参数
。
将更新后的互信息判别器参数应用到初始的互信息判别器,得到预训练的互信息判别器
。
[0018]可选地,如上所述的方法,互信息判别器的损失函数为:
[0019][0020]式中,
y
是根据预训练的互信息判别器预测出的标签值;为真实标签值;
D
MI
(MI(X,Z))
为正样本通过预训练的互信息判别器之后计算得到的第一预测标签值;
D
MI
(MI(X
′
,Z
′
))
为负样本通过预训练的互信息判别器之后的计算得到的第二预测标签值;
y
~
D
MI
(MI(X,Z))
表示实际预测出的标签值可以看作是从第一预测标签值中采样得到的数据;
y
~
D
MI
(MI(X
′
,Z
′
))
表示实际预测出的标签值可以看作是从第二预测标签值中采样得到的数据;
L
MI
为根据预测标签值和真实标签值构造出的损失函数
。
[0021]可选地,如上所述的方法,建立初始的负样本判别器,并对初始的负样本判别器进行迭代训练,以得到预训练的负样本判别器,包括:建立初始的负样本判别器,其中初始的负样本判别器包括负样本判别器参数
。
获取生成的节点特征矩阵,其中生成的节点特征矩阵是指从先验分布中采样得到随机向量经过负样本生成器之后得到的向量
。
根据生成节点特征矩阵以及负样本判别器损失函数,对初始的负样本文档来自技高网...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种图嵌入处理方法,其特征在于,所述方法应用于部署有图嵌入模型的计算机设备,所述图嵌入模型包括自编码器模块
、
互信息判别器模块;其中所述自编码器模块中包括预训练的图卷积编码器,所述互信息判别器模块中包括预训练的互信息判别器;所述方法包括:获取待处理的图信息,并获取所述图信息中的所有节点特征和所有边特征;根据所述所有节点特征确定特征矩阵;根据所述所有边特征确定邻接矩阵;将所述邻接矩阵和所述特征矩阵输入所述预训练的图卷积编码器,以得到所述图信息对应的图嵌入向量;将所述图嵌入向量和所述特征矩阵输入所述预训练的互信息判别器,以得到所述图信息对应的互信息判别结果,其中所述互信息判别结果用于指示所述预训练的图卷积编码器处理前后的图嵌入向量和图信息的特征矩阵的信息关联度,其中所述信息关联度用于指示所述预训练的图卷积编码器的图嵌入处理效果并确定是否需要继续训练图卷积编码器
。2.
根据权利要求1所述的方法,其特征在于,所述图嵌入模型还包括负样本生成器模块,其中所述负样本生成器模块包括预训练的负样本生成器和预训练的负样本判别器;相应地,所述图嵌入模型的训练过程,包括:建立初始的图卷积编码器,并对所述初始的图卷积编码器进行迭代训练,以得到所述预训练的图卷积编码器;建立初始的互信息判别器,并对所述初始的互信息判别器进行迭代训练,以得到所述预训练的互信息判别器;建立初始的负样本生成器,并对所述初始的负样本生成器进行迭代训练,以得到预训练的负样本生成器;建立初始的负样本判别器,并对所述初始的负样本判别器进行迭代训练,以得到预训练的负样本判别器
。3.
根据权利要求2所述的方法,其特征在于,所述建立初始的图卷积编码器,并对所述初始的图卷积编码器进行迭代训练,以得到所述预训练的图卷积编码器,包括:建立所述初始的图卷积编码器,其中所述初始的图卷积编码器包括编码器参数;获取预设数量的训练样本图信息;根据所述预设数量的训练样本图信息以及自编码器损失函数,对所述初始的图卷积编码器进行迭代训练,得到更新后的编码器参数;其中,所述自编码器损失函数由重构损失函数和互信息判别器的损失函数相加得到;将所述更新后的编码器参数应用到所述初始的图卷积编码器,得到所述预训练的图卷积编码器
。4.
根据权利要求3所述的方法,其特征在于,所述重构损失函数为:所述的方法,其特征在于,所述重构损失函数为:式中,
L
REC
是重构损失值;
Z
为所述图嵌入向量;为重构矩阵;
A
i,j
是所述邻接矩阵的第
i
行
j
列的值;是所述重构矩阵的第
i
行
j
列的值;所述互信息判别器的损失函数为:式中,是所述互信息判别器的损失函数值;
A
为所述邻接矩阵;
X
为所述特征矩阵;
E(A,X)
是所述邻接矩阵和所述特征矩阵通过所述预训练的图卷积编码器计算得到的结果;
D
MI
(E(A,X))
是所述预训练的图卷积编码器计算的结果通过所述预训练的互信息判别器得到的值
。5.
根据权利要求2所述的方法,其特征在于,所述建立初始的互信息判别器,并对所述初始的互信息判别器进行迭代训练,以得到所述预训练的互信息判别器,包括:建立所述初始的互信息判别器,其中所述初始的互信息判别器包括互信息判别器参数;获取所述特征数据和所述图嵌入向量的互信息结果作为正样本;获取产生于所述预训练的负样本生成器的生成的节点特征矩阵和生成的图嵌入向量的互信息结果作为负样本;根据所述正样本
、
所述负样本以及互信息判别器的损失函数,对所述初始的互信息判别器进行迭代训练,得到更新后的互信息判别器参数;将所述更新后的互信息判别器参数应用到所述初始的互信息判别器,得到所述预训练的互信息判别器
。6.
根据权利要求5所述的方法,其特征在于,所述互信息判别器的损失函数为:式中,
y
是根据所述预训练的互信息判别器预测出的标签值;为真实标签值;
D
MI
(MI(X,Z))
为所述正样本通过所述预训练的互信息判别器之后计算得到的第一预测标签值;
D
MI
(MI(X
′
,Z
′
))
为所述负样本通过所述预训练的互信息判别器之后的计算得到的第二预测标签值;
y
~
D
MI
(MI(X,Z))
表示实际预测出的标签值可以看作是从第一预测标签值中采样得到的数据;
y
~
D
MI
(MI(X
′
,Z
′
))
表示实际预测出的标签值可以看作是从第二预测标签值中采样得到的数据;
L
MI
为根据预测标签值和真实标签值构造出的损失函数
。7.
根据权利要求2所述的方法,其特征在于,所述建立初始的负样本判别器,并对所述初始的负样本判别器进行迭代训练,以得到预训练的负样本判别器,包括:建立所述初始的负样本判别器,其中所述初始的负样本判别器包括负样本判别器参数;获取所述生成的节点特征矩阵,其中所述生成的节点特征矩阵是指从先验分布中采样得到随机向量经过所述负样本生成器之后得到的向量;根据所述生成节点特征矩阵以及负样本判别器损失函数,对所述初始的负样本判别器进行迭代训练,得到更新后的负样本判别器参数;将所述更新后的负样本判别器参数应用到所述初始的负样本判别器,得到所述预训练的负样本判别器
。8.
根据权利要求7所述的方法,其特征在于,所述负样本判别器损失函数为:
式中,为构造的负样本判别器的损失函数;
x
~
P
data
(x)
技术研发人员:宋英豪,王功举,冯翰斌,李阳,闫龙,胡博文,李梦瑶,李大中,
申请(专利权)人:联通数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。