基于邻域去偏的图对比学习方法及系统技术方案

技术编号:35826114 阅读:25 留言:0更新日期:2022-12-03 13:53
本发明专利技术属于图对比学习技术领域,特别涉及一种基于邻域去偏的图对比学习方法及系统,针对给定的图数据,利用不同图变换方式来获取对应图变换下的图视图;获取原始图中的节点特征向量,并根据节点特征向量对图视图中的所有节点进行聚类,通过将节点划分到对应的类别簇来获取节点的聚类类别;去除对比学习损失函数中每个节点负样本对中与该节点聚类结果相同且处于其m阶邻域的其他节点,减小了对比学习损失函数中的偏差。本发明专利技术通过不同图变换来构造样本数据,并在模型训练中通过去除对比学习中每个节点负样本对中与该节点聚类结果相同的节点,在增加少量计算量的条件下,能够大大减小负样本对的偏差,提高图对比学习模型的性能,便于下游任务中的应用。便于下游任务中的应用。便于下游任务中的应用。

【技术实现步骤摘要】
基于邻域去偏的图对比学习方法及系统


[0001]本专利技术属于图对比学习
,特别涉及一种基于邻域去偏的图对比学习方法及系统。

技术介绍

[0002]图自监督学习可以被分为图对比模型、图生成模型和图预测模型。图对比学习是对比学习在图神经网络中的应用。对比学习是一种自监督学习方法,用于在没有标签的情况下,通过让模型学习哪些数据点相似或不同来学习数据集的一般特征。对比学习的核心思想是把正样本之间距离拉近,把正样本与负样本之间的距离拉远。基于此思想,一些经典的对比学习模型被提出:MoCo、SimCLR、MoCo V2和CPC等。
[0003]受到MoCo,SimCLR,DIM等图像对比学习的启发,现有利用图对比编码(Graph Contrastive Coding,GCC)在网络中执行随机游走,构造关于节点的子图进行对比学习,又如,CGNN通过不同的采样邻居学习节点的一致表示;GraphCL中,通过设计四种类型的图数据扩充:节点删除、边缘扰动、属性掩蔽、子图,并结合各种先验知识在实际应用中选择数据扩充方法;GCA基于节点中心性测度进行数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于邻域去偏的图对比学习方法,其特征在于,包含如下内容:针对给定的图数据,利用不同图变换方式来获取对应图变换下的图视图;获取原始图视图的节点特征向量,并根据节点特征向量对图视图的所有节点进行聚类,通过将节点划分到对应的类别簇来获取节点的聚类类别;去除对比学习损失函数中每个节点所有的负样本对中与该节点聚类结果相同的且处于其m阶邻域的其他节点,并使用去偏后的损失函数训练图对比学习网络。2.根据权利要求1所述的基于邻域去偏的图对比学习方法,其特征在于,图变换方式包括但不局限于:边删除、边增加、特征扰动及属性屏蔽。3.根据权利要求1或2所述的基于邻域去偏的图对比学习方法,其特征在于:针对图数据中的节点,通过获取原始视图对应节点的特征向量,并依据节点特征向量利用KNN算法对所有节点进行聚类,将节点划分到对应类别簇中,以获取节点的聚类类别。4.根据权利要求1所述的基于邻域去偏的图对比学习方法,其特征在于,图对比学习网络训练中,将2个图视图分别输入至图对比模型的2个通道,利用网络模型的编码器来获取每个图视图对应的嵌入向量。在对比学习中利用损失函数去除每个节点负样本对中与该节点聚类结果相同且处于其m阶邻域的其他节点。5.根据权利要求1或4所述的基于邻域去偏的图对比学习方法,其特征在于,基于邻域去偏的图对比学习的损失函数可以表示为:其中,和分别为第i个节点两个图视图对应的嵌入向量,s(x,y)=(x)
T
y计算x和y两个向量的相似度,为指示函数,i≠j表示当节点i与j不相等,表示节点j...

【专利技术属性】
技术研发人员:乔凯石舒豪闫镔陈健海金金杨帅宋宝杰杨杰
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1