【技术实现步骤摘要】
一种基于基序粗化的图表示学习方法
[0001]本专利技术属于图表示学习领域,特别涉及一种基于基序粗化的图表示学习方法。
技术介绍
[0002]图数据是数据挖掘、机器学习领域常见的数据类型之一:节点表示数据对象,边表示数据对象之间的关系。现实世界中的许多复杂系统都可以抽象成图数据,例如社交网络、交通网络、生物分子网络等。图数据作为一种高维且稀疏的非欧几里德结构数据,难以被高效利用,因此,图表示学习方法借助机器学习算法将图中的节点映射到低维、实值、稠密的向量空间中。
[0003]起初,图表示学习方法利用机器学习方法中的局部线性嵌入和拉普拉斯特征映射等方法,将高维、稀疏的图数据映射到低维、稠密的向量空间中。然而,这类方法的计算复杂度与图数据规模密切相关,因此,难以适用于大规模数据集。随后,一些学者提出,利用随机游走或矩阵分解保留图的宏观或微观结构,这类方法一定程度上降低了算法的时间复杂度,但仍然无法有效地刻画图数据间的高维非线性关系。随着深度学习的发展,涌现出许多基于深度学习的图表示学习方法,这类方法定义了多层非线性函数, ...
【技术保护点】
【技术特征摘要】
1.一种基于基序粗化的图表示学习方法,其特征在于,包括以下步骤:S1、对原始图进行预处理,统计各个基序的数量,选择原始图中频繁出现的一种或多种基序模式组成基序集合;S2、利用图粗化的方法聚合原始图中一种或多种固定模式的基序结构,获得对应的基序粗化图;S3、利用图编码器分别对原始图和基序粗化图的节点表示进行编码,得到对应的节点表示h
′
i
和基序表示m
i
;S4、利用权重重分配策略,计算基序粗化图中每个节点受各个基序影响的权重,进而将基序表示转化为基于基序结构的节点表示h
″
i
;S5、将节点表示h
′
i
和基于基序结构的节点表示h
″
i
拼接作为最终的节点表示h
i
={h1,h2,...,h
n
}。2.如权利要求1所述的基于基序粗化的图表示学习方法,其特征在于,步骤S1的具体步骤为:给定原始图G=(A,X),对原始图进行预处理以便统计原始图G中各个基序的数量,并选择原始图中频繁出现的一种或多种基序模式组成基序集合G
(k)
为基序集合G
M
中的一张基序图,K代表基序图的数量,k表示基序的序号。3.如权利要求2所述的基于基序粗化的图表示学习方法,其特征在于,步骤S2的具体步骤为:给定原始图的邻接矩阵A和特征矩阵X,基序集合定义如式(1)所示的采样算子C
(k)
和标识算子Γ
(k)
,其中,i,j是节点序号,C
(k)
表示基序结构内部节点之间的连通情况,Γ
(k)
是由基序中的节点所组成的列表;若节点v
i
在节点v
j
的基序序列中,则C
(k)
[i,j]值为1,表明节点v
i
和节点v
j
属于同一个基序结构,且二者之间有连边;利用采样算子C
(k)
和原始图的邻接矩阵A,得到与原始图的邻接矩阵等维度的基序邻接矩阵A
(k)
,如式(2)所示,A
(k)
=(C
(k)
)
T
AC
(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)对基序邻接矩阵A
(k)
进行异或操作,将基序集合中不同规模的基序结构内部的连通情况映射到原始图的邻接矩阵中,如式(3)所示,计算原始图的邻接矩阵A与基序内部邻接矩阵A
int
之间的差值,得到原始图中各个基序之间的连通情况,A
ext
=A
‑
A
int
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。