一种采用图对比学习的机会网络节点嵌入方法技术

技术编号:31314480 阅读:23 留言:0更新日期:2021-12-12 22:28
本发明专利技术公开了一种采用图对比学习的机会网络节点嵌入方法,包括:S1,处理机会网络源数据,构建机会网络的拓扑图表示与特征表示;S2,对机会网络进行增广操作,得到两种不同的视图,并利用节点连边次数确定机会网络中的正例节点集与负例节点集;S3,采用图注意力网络对不同视图下的机会网络进行表征,得到其相应节点嵌入向量;S4,采用多层感知机映射不同视图下的节点嵌入向量,并通过预定义的损失函数,最小化正例节点集中不同视图间节点映射向量的余弦相似性以更新图注意力网络的训练参数。本发明专利技术能够应用于多种基于机器学习的机会网络下游任务研究模型中,解决其在现实环境下由于标签质量低下导致的过拟合、泛化性差等问题,提高模型精度。提高模型精度。提高模型精度。

【技术实现步骤摘要】
一种采用图对比学习的机会网络节点嵌入方法


[0001]本专利技术涉及机会网络分析
,特别是涉及一种采用图对比学习的机会网络节点嵌入方法。

技术介绍

[0002]在现实环境中,网络中的节点具备移动性。然而由于节点通讯范围的限制,节点间的无线链路会发生无规律的断开与连接,这严重影响了网络中节点间的通讯效率。因此,机会网络(Opportunistic Network)应运而生,机会网络是一种不需要源节点与目标节点存在完整无线链路的新型网络,其能够在无线链路断开的情况下完成节点间的通讯。
[0003]近几年来,机会网络节点嵌入已成为机会网络分析领域中重要的研究方向。网络嵌入方法旨在学习一种编码的方法,该方法可以将节点转化为保留图拓扑与特征属性的嵌入向量,并根据下游任务设计相应的模型以进行研究。然而,在现有机会网络领域的研究中,绝大部分的节点嵌入方法需要得到机会网络相应的标签并基于此进行训练,在现实环境中,机会网络下游任务标签经常由于难以获取或者获取成本较高而出现标签质量低下问题,导致相应模型出现过拟合、泛化性差等问题。

技术实现思路

[0004]针对上述问题,本专利技术的目的在于提出一种采用图对比学习的机会网络节点嵌入方法,以解决在现实环境中机会网络下游任务标签质量低下,导致相应模型出现过拟合、泛化性差等问题。
[0005]本专利技术采用的技术方案如下:一种采用图对比学习的机会网络节点嵌入方法,包括如下步骤:
[0006]S1,处理机会网络源数据并构建机会网络的拓扑图表示与特征表示,根据机会网络数据中的连边次数w与连边时长Δt构建机会网络邻接矩阵与特征矩阵
[0007]S2,从拓扑与特征两方面对机会网络进行增广操作,分别得到两种不同的视图τ1与τ2,并根据节点连边次数w确定机会网络中的正例与负例;
[0008]S3,分别将不同视图下的邻接矩阵与特征矩阵与与输入到图注意力网络(Graph Attention Network,GAT)中,得到机会网络各节点的嵌入向量与其中D为嵌入向量维度;
[0009]S4,采用多层感知机(Multilayer Perceptron,MLP)对节点嵌入向量与进行转换得到映射向量与计算其映射向量间的余弦相似性,其中D

为映射向量维度且D

>D,并利用预定义的损失函数,通过最小化正例节点集中不同视图下节点映射向量的余弦相似性的方式训练GAT。
[0010]自此,训练好的GAT将具备输出具有高效表征能力的机会网络节点的嵌入向量,可
用于各类下游任务中。
[0011]可选的,在步骤S1中,机会网络邻接矩阵A根据节点间是否存在连边构建,具体构建方法如公式(1)所示:
[0012][0013]其中ω
i,j
为节点v
i
与v
j
的连边数,A
i,j
对应v
i
与v
j
在邻接矩阵A中的位置。
[0014]可选的,在步骤S1中,机会网络特征矩阵X由机会网络快照G
m
(m∈{1,2,...,M})中各节点对应的平均活跃时长x
m
拼接而成。机会网络快照G
m
构建方法为:确定机会网络快照时间跨度ΔT,将机会网络均匀地分割为M个机会网络快照G
m
(m∈{1,2,...,M})。x
m
的计算方法如公式(2)所示:
[0015][0016]其中,为机会网络快照G
m
中节点的一阶邻居,K为中节点的个数,为节点与中的节点的连边时长。机会网络快照时间跨度ΔT根据具体机会网络数据集的统计单位(天,月)确定。
[0017]可选的,在步骤S2中,利用移除拓扑图中重要度最低的U条边实现基于拓扑的机会网络增广,即在视图τ1,机会网络的特征矩阵X不变,邻接矩阵A发生变化。拓扑图中各条连边的重要度计算方法如公式(3)所示:
[0018][0019]其中Γ(v
i
)为节点v
i
的一阶邻居个数,Γ(v
j
)为节点v
j
的一阶邻居个数。具体的移除方法为修改邻接矩阵A中对应边e
i,j
的A
i,j
为0。U的大小为机会网络拓扑图中连边数量的5%;
[0020]可选的,在步骤S2中,利用掩盖极大连通节点对数最小的V个机会网络快照所对应在特征矩阵中的V维特征实现基于特征的机会网络增广,即在视图τ2中,机会网络的邻接矩阵A不变,特征矩阵X发生变化。机会网络快照G
m
中的极大连通节点对数ONPairwise
m
计算方法如公式(4)所示:
[0021][0022]其中为机会网络快照G
m
的第i个连通分量中所包含节点的个数,C为机会网络快照G
m
包含连通分量的个数。具体掩盖方法为修改特征矩阵X中机会网络快照G
m
对应的第m列向量x
m
为0。V的大小为机会网络快照总数的5%。
[0023]可选的,在步骤S2中,机会网络中的正例节点集与负例节点集基于机会网络节点连边次数w确定,将w最高的前R个节点组成正例节点集其余节点则组成负例节点集
[0024]可选的,在步骤S3中,将机会网络视图τ1与τ2对应的邻接矩阵与特征矩阵与
与分别输入到两个结构相同且参数共享的GAT模型中,得到机会网络节点嵌入向量与
[0025]可选的,在步骤S4中,机会网络节点嵌入向量与输入到两个结构相同且参数共享的MLP模型中,获得节点映射向量与并利用其计算同一节点在不同视图下映射向量之间的余弦相似性,计算方法如公式(5)所示:
[0026][0027]可选的,在步骤S4中,最小化正例样本中同一节点在不同视图下映射向量之间的余弦相似性并定义损失函数loss,其计算方法如公式(6)所示:
[0028][0029]其中与为来自正例节点集的节点在视图τ1与τ2下的节点映射向量,与为所有节点在视图τ1与τ2下的节点映射向量。
[0030]根据本专利技术提供的采用图对比学习的机会网络节点嵌入方法,通过学习节点拓扑与特征的重要信息进行节点嵌入向量的优化,首先处理机会网络源数据并构建机会网络的拓扑图表示与特征表示,对机会网络进行增广操作获得其两种不同的视图,通过图注意力网络对不同机会网络视图进行表征得到节点嵌入向量,其次定义机会网络中的正例节点集与负例节点集,并采用多层感知机将不同视图中的节点进行映射,通过最小化正例节点集在不同视图中映射向量的余弦相似性对图注意力网络进行训练,最后将机会网络的拓扑表示与特征表示输入到最终的图注意力网络中进行表征,获取节点嵌入向量并运用于各类下游任务中,有效解决了在现实环境中机会网络下游任务标签质量低下导致的相应模型具有过拟合、泛化性差等问题,提高模型精度。
附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图对比学习的机会网络节点嵌入方法,其特征在于,包括如下步骤:S1,处理机会网络源数据,构建机会网络的拓扑图表示与特征表示;S2,对机会网络进行增广操作,得到两种不同的视图,并利用节点连边次数确定机会网络中的正例节点集与负例节点集;S3,采用图注意力网络对不同视图下的机会网络进行表征,得到其相应节点嵌入向量;S4,采用多层感知机映射不同视图下的节点嵌入向量,并通过预定义的损失函数,最小化正例节点集中不同视图间节点映射向量的余弦相似性以更新图注意力网络的训练参数。2.根据权利要求1所述的图对比学习的机会网络节点嵌入方法,其特征在于,步骤S1中机会网络的特征由特征向量表示,而特征向量X由机会网络快照G
m
(m∈{1,2,...,M})中各节点的平均活跃时长拼接而成,其中,N为机会网络节点个数,M为机会网络快照个数,x
m
计算方法如下式所示:其中,为机会网络快照G
m
中节点的一阶邻居,K为中节点的个数,为节点与中节点的连边时长。3.根据权利要求2所述的图对比学习的机会网络节点嵌入方法,其特征在于,步骤S2中机会网络增广操作的具体步骤为:基于拓扑的机会网络增广方法:对于机会网络拓扑图中的任意一条连边e
i,j
,计算其边重要度其计算方法如下式所示:其中Γ(v
i
)为节点v
i
的一阶邻居个数,Γ(v

【专利技术属性】
技术研发人员:魏正皓舒坚
申请(专利权)人:南昌航空大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1