一种基于类型与节点约束随机游走的异构网络表示学习方法技术

技术编号:28036703 阅读:33 留言:0更新日期:2021-04-09 23:19
本发明专利技术涉及一种基于类型与节点约束随机游走的异构网络表示学习方法,包括:步骤一,确定基于类型和节点约束的随机游走策略,并由此构建转移概率模型;步骤二,通过随机游走得到游走序列W;步骤三,将得到的游走序列W与Skip‑Gram模型相结合以对游走序列W进行训练与学习;步骤四,通过优化基于Skip‑Gram模型的神经网络目标函数以学习到网络中节点的向量表示。从而能够通过采用节点类型的共现概率作为节点类型的选取策略和采用节点间的邻接关系约束节点的选取,并控制节点的回溯、广度和深度游走,从而将节点间的邻接关系作为节点的游走策略与节点选取的策略,进而实现了异构网络中各类节点间灵活的游走和节点采样的均匀性。

【技术实现步骤摘要】
一种基于类型与节点约束随机游走的异构网络表示学习方法
本专利技术涉及表示学习
,尤其涉及一种基于类型与节点约束随机游走的异构网络表示学习方法。
技术介绍
现实世界中许多系统都可以建模为异构信息网络(简称异构网络),例如文献科技网络、社交媒体网络和医疗信息网络,等等。其中,最经典的DBLP文献科技网络(简称DBLP网络)。异构网络同时包含了多种类型的实体和关系,比同构网络蕴含了更丰富的语义信息,因此,异构网络在各领域得到了广泛应用。随着网络规模的不断增加,传统方法(如基于邻接矩阵的方法)成为阻碍网络分析和挖掘任务的瓶颈。随着网络中语义和结构信息的不断增加,现有同构网络的理论和方法要么无法直接使用,要么复杂度大大增加。为了解决上述问题,异构网络表示学习成为当前的研究热点。异构网络表示学习就是学习给定异构网络G=(V,E,A,R)的一个映射函数f:V→X∈R|V|×d,d<<|V|,从而得到网络中节点的向量表示。这些向量表示能够捕捉网络中节点之间的结构和语义关系。与同构网络表示学习不同,异构网络中节点的向量表示不仅可以同时保本文档来自技高网...

【技术保护点】
1.一种基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,包括:/n步骤一,确定基于类型和节点约束的随机游走策略,并由此构建转移概率模型;/n步骤二,通过随机游走得到游走序列W;/n步骤三,将得到的游走序列W与Skip-Gram模型相结合以对游走序列W进行训练与学习;/n步骤四,通过优化基于Skip-Gram模型的神经网络目标函数以学习到网络中节点的向量表示;/n其中,所述基于Skip-Gram模型的神经网络目标函数如式(1)所示:/n

【技术特征摘要】
1.一种基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,包括:
步骤一,确定基于类型和节点约束的随机游走策略,并由此构建转移概率模型;
步骤二,通过随机游走得到游走序列W;
步骤三,将得到的游走序列W与Skip-Gram模型相结合以对游走序列W进行训练与学习;
步骤四,通过优化基于Skip-Gram模型的神经网络目标函数以学习到网络中节点的向量表示;
其中,所述基于Skip-Gram模型的神经网络目标函数如式(1)所示:



式(1)中,表示节点vi与节点vj之间的共现概率,表示sigmoid函数,表示节点vi的向量,K表示负采样的个数。


2.根据权利要求1所述的基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,在所述步骤一中,所述基于类型和节点约束的随机游走策略包括:
步骤a,根据网络模式和研究目标,将节点类型划分为主类和辅类;
步骤b,根据游走路径中连续三个节点类型的共现概率值,选取概率值最大的组合确定下一节点的类型;
步骤c,根据连续三个节点之间拓扑结构中的邻接关系,以及回溯、深度或广度优先游走的概率值以确定节点的选取。


3.根据权利要求2所述的基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,在所述步骤a中,将所述网络模式记为TG=(A,R),包括带有实体类型映射φ:V→A和实体关系类型映射ψ:E→R的异构网络G=(V,E,A,R)的元模板;
其中,在异构网络G=(V,E,A,R)中,
V={v1,v2,…,vi,…,vI}表示节点的集合;
E={e1,e2,…,ej,…,eJ}表示边的集合;
A={A1,A2,…,An,…,AN}(N≤I)表示节点类型的集合;
R={R1,R2,…,Rm,…,RM}(M≤J)表示边类型的集合;
|V|=l表示节点的数量,|E|=J表示边的数量,|A|=N表示节点类型的数量,|R|=M表示边类型的数量,所述异构网络G=(V,E,A,R)满足|R|=M>1或|A|=N>1;
各所述节点vi∈V均表示一个特定的节点类型,记为φ(vi)=An∈A;
各所述边ej=(vi,vj)∈E均表示一个特定的关系类型,记为ψ(ej)=Rm∈R。


4.根据权利要求3所述的基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,在所述步骤a中,所述主类为被研究对象的类型,记为O;其余为辅类,记为此时,节点类型的集合记为且其中,主类辅类
所述主类和辅类还能够通过下式进行表达:
O={A1,A2,…,An},其中,n1+n2=N,n1=n,n2=N-n,n1≥1且n2≥1:
在所述异构网络G=(V,E,A,R)中,若φ(vi)∈O,则节点vi的类型为主类O,记为Type(vi)∈O;若则节点vi的类型为辅类记为
在随机游走时,节点将在主辅类之间进行跳转,节点类型的停留概率如式(2)所示:



式(2)中,α表示节点停留在O类型的概率,α∈[0,1],1-α表示节点停留在类型的概率。


5.根据权利要求4所述的基于类型与节点约束随机游走的异构网络表示学习方法,其特征在于,所述转移概率模型包括节点vi+1类型的转移概率PType和节点vi+1的转移概率Plnner;
给定异构网络G=(V,E,A,R),起始节点v0和游走长度L进行随机游走,vi-1和vi分别表示随机游走序列W中的第i-1个节点和第i个节点,用以计算第i+1个节点vi+1的转移概率,节点vi+1的转移概率如式(3)所示:
P(vi+1|vi,vi-1)=PTvpe(Type(vi+1)|Type(vi),Type(vi-1))PInner(vi+1|vi,vi-1)(3)
式...

【专利技术属性】
技术研发人员:陈晓郭景峰郝童
申请(专利权)人:河北科技师范学院燕山大学
类型:发明
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1