一种基于元路径的动态异质网络表示方法技术

技术编号:32519740 阅读:17 留言:0更新日期:2022-03-02 11:21
本发明专利技术属于图网络表示学习领域,尤其涉及一种基于元路径的动态异质网络表示方法,包括构造动态异质网络,并根据时间加权元路径从网络中采样不同的时间加权元路径序列;将网络节点的向量进行预处理,通过GRU来聚合预处理后每条元路径的网络节点序列的信息;采用相对时间编码技术对节点序列的时间进行编码;采用Bi

【技术实现步骤摘要】
一种基于元路径的动态异质网络表示方法


[0001]本专利技术属于图网络表示学习领域,尤其涉及一种基于元路径的动态异质网络表示方法。

技术介绍

[0002]网络数据通常是非结构化数据,直接使用机器学习模型来挖掘网络中的信息是很困难的。网络表示学习是将高维稀疏图数据映射到低维空间,同时保留网络中的结构信息,从而得到低维稠密的结构化向量表示。
[0003]目前,在静态网络表示学习和动态同质网络表示学习上的研究比较成熟,但是更加趋近于网络实际的动态异质网络研究处于起步阶段,对其进行探讨研究很有必要的。
[0004]网络表示学习是在保留网络结构和语义信息的同时,将网络中的节点表示成低维向量,以利于图挖掘的后续任务,例如链路预测、节点分类,聚类等。现有许多异质网络表示学习方法是为静态异质网络设计,忽略了网络空间信息(拓扑结构和属性)会随时间变化的特点,而只是简单地将不同时间对应的空间(结构)压缩在一起。由于网络是随时间不断变化的,前一秒没有关系的两个节点可能会在下一秒关联,而节点之间链接的建立显然会改变网络的拓扑结构(空间)。因此,只考虑静态的处理方式不符合实际网络的演化规律。而另一类动态同质网络表示学习方法并未考虑网络节点和链接的差异,如果将其直接应用于动态异质网络中,将不可避免地丢失一些语义信息。

技术实现思路

[0005]为了使下游任务可以对接节点分类、聚类、可视化等,有效提升动态异质图网络节点的学习和表示能力,本专利技术提出一种基于元路径的动态异质网络表示学习方法,构建DHNR模型对网络节点进行表示学习,DHNR模型中包括GRU和带注意力机制的Bi

GRU,DHNR模型获取节点表示向量的过程具体包括以下步骤:
[0006]S1:将网络节点建立链接的时间作为链接权重,保留在网络中,构造动态异质网络;
[0007]S2:根据时间加权元路径从网络中采样不同的时间加权元路径序列;
[0008]S3:对网络进行预处理,得到每个节点初始向量,将每条时间加权元路径序列及其向量进行输入,通过GRU来聚合每条元路径的网络节点序列的信息;
[0009]S4:采用相对时间编码技术作为时间编码器,对节点序列的时间进行编码;
[0010]S5:采用Bi

GRU方法获取节点序列的信息的深层次特征信息,将时间特征和结构特征进行聚合;
[0011]S6:使用带注意力机制的Bi

GRU来交互不同时间下不同序列的特征信息,得到节点的最终表示。
[0012]进一步的,动态异质网络表示为G=(V,E,T),其中V表示节点集合,E表示链接集合,T表示链接上时间集合,动态异质网络中节点和节点类型间的映射函数为A表
示节点类型集合;链接和链接类型间的映射函数为ψ:E

R,R表示链接类型集合,动态异质网络中|A|+|R|>2,动态异质网络中的一条时间链接表示为(i,j,t)且(i,j,t)∈E,时间链接(i,j,t)表示t时刻节点i连接到节点j,|A|表示求节点类型集合中节点类型的数量,|R|表示求链接类型集合中链接类型的数量。
[0013]进一步的,根据时间加权元路径从网络中采样不同的时间加权元路径序列包括以下步骤:
[0014]构建时间加权路径,即对一个元路径在时间属性值的引导下得到该类型元路径对应的时间加权元路径;
[0015]获取时间加权的元路径序列集合,即获取每种类型的元路径分别在|T|种不同的时间属性值下的时间加权元路径,将时间加权的元路径序列集合表示为
[0016]其中,k为元路径的类型数量;T为时间属性值集合,|T|为时间属性值集合中时间属性的数量;表示第k个类型的元路径在第|T|个时间属性值引导下的时间加权元路径。
[0017]进一步的,对网络节点的向量进行预处理包括:
[0018]为每种类型的节点设置一个变换矩阵,使得每种类型的节点通过变换矩阵投影到相同的特征空间中,所述的特征空间中包含所有类型的节点特征空间中的特征,则节点类型为φ
i
的节点n
i
投影过程表示为:
[0019][0020]其中,x
i
为节点n
i
的原始特征;为节点n
i
的投影特征;为节点类型为φ
i
的节点的变换矩阵。
[0021]进一步的,通过GRU来聚合每条元路径的网络节点序列的信息包括以下过程:
[0022]将节点的不同时间加权元路径信息进行聚合,形成一个初步的向量表示,则节点n0的聚合过程包括:
[0023][0024][0025]其中,为节点n
i
的投影特征;φ(n
i
)为节点n
i
的节点类型,n
i
为节点n0在时间加权元路径序列上的m+1

a跳邻居节点;为序列中目标节点的m+1跳邻居节点的隐藏状态;表示节点n
i
通过GRU输出的第a层隐藏状态,且0<a≤m1+,m为序列链接数量;A
m+1
为目标节点的m+1跳邻居类型;A
m+1

a
为m+1

a跳邻居类型;表示将第a

1层隐藏层输出的隐藏信息与输入GRU的节点n
i
的投影特征进行聚合。
[0026]进一步的,将第a

1层隐藏层输出的隐藏信息与输入GRU的节点n
i
的投影特征进行聚合,即:
[0027][0028][0029][0030][0031]其中,A
z
、A
r
、A
h
和B
z
、B
r
、B
h
是GRU的模型参数;z
i
、r
i
是GRU中的更新门和遗忘门,其取值范围都是[0,1];表示逐元素乘法;为对输入向量和前一时刻状态向量进行遗忘后的新状态;σ为激活函数;为经过一个GRU单元处理的最终状态。
[0032]进一步的,对节点序列的时间进行编码,即定义一组固定的正弦函数作为时间偏置对每个序列上的时间进行编码,编码过程包括:
[0033][0034][0035][0036]其中,Base(t)、Base(t,2i)和Base(t,2i+1)为时间偏置函数,为t时刻的时间向量,T_Linear为线性微调函数,d为向量维度。
[0037]进一步的,将时间特征和结构特征进行聚合包括:
[0038][0039]其中,表示将时间特征和结构特征进行聚合后得到的特征;是节点的特征,当i为st时表示节点的时间特征,当i为RT(t)时表示节点的语义特征;Mean()表示求数组平均值的函数,对双向GRU隐藏状态求均值;表示双向GRU的表示形式。
[0040]进一步的,使用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于元路径的动态异质网络表示方法,其特征在于,构建DHNR模型对网络节点进行表示学习,DHNR模型中包括GRU和带注意力机制的Bi

GRU,DHNR模型获取节点表示向量的过程具体包括以下步骤:S1:将网络节点建立链接的时间作为链接权重,保留在网络中,构造动态异质网络;S2:根据时间加权元路径从网络中采样不同的时间加权元路径序列;S3:对网络进行预处理,得到每个节点初始向量,将每条时间加权元路径序列及其向量进行输入,通过GRU来聚合每条元路径的网络节点序列的信息;S4:采用相对时间编码技术作为时间编码器,对节点序列的时间进行编码;S5:采用Bi

GRU方法获取节点序列的信息的深层次特征信息,将时间特征和结构特征进行聚合;S6:使用带注意力机制的Bi

GRU来交互不同时间下不同序列的特征信息,得到节点的最终表示。2.根据权利要求1所述的一种基于元路径的动态异质网络表示方法,其特征在于,动态异质网络表示为G=(V,E,T),其中V表示节点集合,E表示链接集合,T表示链接上时间集合,动态异质网络中节点和节点类型间的映射函数为A表示节点类型集合;链接和链接类型间的映射函数为ψ:E

R,R表示链接类型集合,动态异质网络中|A|+|R|>2,动态异质网络中的一条时间链接表示为(i,j,t)且(i,j,t)∈E,时间链接(i,j,t)表示t时刻节点i连接到节点j,|A|表示求节点类型集合中节点类型的数量,|R|表示求链接类型集合中链接类型的数量。3.根据权利要求1所述的一种基于元路径的动态异质网络表示方法,其特征在于,根据时间加权元路径从网络中采样不同的时间加权元路径序列包括以下步骤:构建时间加权路径,即对一个元路径在时间属性值的引导下得到该类型元路径对应的时间加权元路径;获取时间加权的元路径序列集合,即获取每种类型的元路径分别在|T|种不同的时间属性值下的时间加权元路径,将时间加权的元路径序列集合表示为其中,k为元路径的类型数量;T为时间属性值集合,|T|为时间属性值集合中时间属性的数量;表示第k个类型的元路径在第|T|个时间属性值引导下的时间加权元路径。4.根据权利要求1所述的一种基于元路径的动态异质网络表示方法,其特征在于,对网络节点的向量进行预处理包括:为每种类型的节点设置一个变换矩阵,使得每种类型的节点通过变换矩阵投影到相同的特征空间中,所述的特征空间中包含所有类型的节点特征空间中的特征,则节点类型为φ
i
的节点n
i
投影过程表示为:其中,x
i
为节点n
i
的原始特征;为节点n
i
的投影特征;为节点类型为φ
i
的节点的变换矩阵。5.根据权利要求1所述的一种基于元路径的动态异质网络表示方法,其特征在于,通过GRU来聚合每条元路径的网络节点序列的信息包括以下过程:
将节点的不同时间加权元路径信息进行聚合,形成一个初步的向量表示,则节点n0的聚合过程包括:合过程包括:其中,为节点n
i
的投影特征;φ(n
i
)为节点n
i
的节点类型,n
i
为节点n0在时间加权元路径序列上的m+1

a跳邻居节点;为序列中目标节点的m+1跳邻居节点的隐藏状态;表示节点n
i
通过GRU输出的第a层隐藏状态,且0<a≤1m+,m为序列链接数量;A
...

【专利技术属性】
技术研发人员:谭洪胜刘群袁铭王国胤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1