当前位置: 首页 > 专利查询>华侨大学专利>正文

一种基于拓扑结构保持的图表示学习方法及系统技术方案

技术编号:34451429 阅读:64 留言:0更新日期:2022-08-06 16:52
本发明专利技术公开一种基于拓扑结构保持的图表示学习方法及系统,能在保持图数据拓扑不变性的前提下,融合拓扑结构和语义特征来共同提高图表示学习的质量;方法包括:针对图数据的特性,设计拓扑结构保持的自监督任务;输入图数据,使用图卷积神经网络对其进行特征编码,从而学习到节点的初始向量表示;将学习到的节点初始向量表示输入到TGSSL(Topology

【技术实现步骤摘要】
一种基于拓扑结构保持的图表示学习方法及系统


[0001]本专利技术涉及图数据与表示学习领域,特别是指一种基于拓扑结构保持的图表示学习方法及系统。

技术介绍

[0002]在将图数据映射到低维向量空间时,如何能使向量尽可能保存节点在图上的语义信息和结构信息是图表示学习研究的关键。图数据一般具有社区性、层次性等结构特点,且图数据的结构对图推理至关重要。但是现有的图神经网络等图表示学习方法更多地考虑保留图中节点的语义特征和低阶邻居节点的信息,而丢失了图中节点间更高阶的邻近性和其他类型的图结构特性。因此,在对图数据进行图表示学习时需在保持其拓扑不变性的前提下,融合该拓扑结构和节点特征来进一步提升表示学习的质量。

技术实现思路

[0003]本专利技术的主要目的在于克服现有的图数据表示学习方法在学习节点向量时无法有效融合结构信息的问题,提出一种基于拓扑结构保持的图表示学习方法及系统,采用一种拓扑结构保持的图自监督学习模型(Topology

preserving Graph Self

Supervised本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于拓扑结构保持的图表示学习方法,其特征在于,包括如下步骤:步骤1、针对图数据的特性,设计拓扑结构保持的自监督任务;步骤2、输入图数据,使用图卷积神经网络对其进行特征编码,从而学习到节点初始向量表示;步骤3、将学习到的节点初始向量表示输入到TGSSL模型进行图自监督学习,最终在结构保持的基础上获得高质量的节点向量表示。2.根据权利要求1所述的一种基于拓扑结构保持的图表示学习方法,其特征在于,所述步骤1具体包括:步骤1.1、基于图数据的结构设计图拓扑划分自监督任务,具体为利用图数据中边的连接密度情况对图进行分区,再预测节点所属分区索引;步骤1.2、基于图数据的结构设计mask节点自监督任务,具体为通过随机mask部分节点的特征,再根据其邻居节点特征对mask节点进行重构。3.根据权利要求2所述的一种基于拓扑结构保持的图表示学习方法,其特征在于,所述步骤1.1具体包括:步骤1.1.1、利用图划分算法METIS,将图数据划分为K∈{1,2,

,|V|}个社区,输出具有分区索引的节点集合{V
p_1
,

,V
p_k
,

,V
p_K
|V
p_k
∈V,k=1,

,K};其中,|V|为图数据的节点个数,点个数,步骤1.1.2、将节点分区索引作为图拓扑划分任务的伪标签y
TP
供TGSSL模型进行学习;其中,第n个节点的分区索引为k可形式化表达为:y
TP_n
=k,if v
n
∈V
p_k
,n=1,

,|V|,步骤1.1.3、基于伪标签y
TP
定义图拓扑划分任务损失函数L
TP
为多分类交叉熵:其中,N为图拓扑划分的节点总样本数,是第n个节点为第k个社区的预测值。4.根据权利要求3所述的一种基于拓扑结构保持的图表示学习方法,其特征在于,所述步骤1.2具体包括:步骤1.2.1、在图数据中,随机mask|M
a
|个节点的特征x;其中,步骤1.2.2、将...

【专利技术属性】
技术研发人员:王华珍刘晓聪陈坚何霆
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1