当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于循环神经网络的图节点分类方法技术

技术编号:18497997 阅读:22 留言:0更新日期:2018-07-21 20:36
本发明专利技术涉及一种基于循环神经网络的图节点分类方法,该方法包括如下步骤:S1、给定一个原始图,构建针对每个节点的中心图;S2、初始化每个中心图节点的初始状态表示向量,同时获取中心图邻接矩阵;S3、以中心图邻接矩阵和初始状态表示向量为输入,节点类型为输出训练基于循环神经网络的分类模型;S4、将原始图邻接矩阵和待分类的节点的初始状态表示向量输入至所述的分类模型得到节点类型。与现有技术相比,本发明专利技术能够捕捉图中节点全局信息和局部信息,分类准确度高。

A graph node classification method based on recurrent neural network

The invention relates to a graph node classification method based on recurrent neural network, which includes the following steps: S1, a given original map, a central graph for each node; S2, initialization of the initial state representation of each center graph node, and the adjacency matrix of the center graph; S3, and the adjacency moments of the center graph. The array and initial state representation vectors are input, and the type of node is trained based on the recurrent neural network based classification model; S4, input the initial state representation vector of the original graph adjacency matrix and the node to be classified to the classified model to get the node type. Compared with the existing technology, the invention can capture the global and local information of the nodes in the graph, and has high classification accuracy.

【技术实现步骤摘要】
一种基于循环神经网络的图节点分类方法
本专利技术涉及一种图节点分类方法,尤其是涉及一种基于循环神经网络的图节点分类方法。
技术介绍
图模型结构广泛存在于现实社会中,如在线社交网络就是反应人与人关系的图结构,用户为图中的节点,用户间的关系为图的边。因此,对图结构的分析是诸多现实问题的理论基础。节点是图的基本组成部分,因此对节点的分析十分重要,这其中对节点类型的预测是现实社会中尤其是社交网络中用户分析的关键任务。深度神经网络在图像、文本和语音识别等领域取得了众多突破性进展。循环神经网络模型(RecurrentNeuralNetwork,RNN)作为一类深度神经网络被广泛用于和序列相关的模型中。在自然语言中,词语在句子中的排列具有顺序性,因此可以用RNN模型捕捉词语间的关系。RNN模型将短文本中的单词按顺序输入模型,并最终将文本映射为一个低维实值向量。近年来,有大量的工作研究基于深度神经网络的图表示学习。图表示学习将图中的每个节点表示为低维向量(NetworkEmbedding),这些低维向量反映了节点在图中的结构信息。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于循环神经网络的图节点分类方法。本专利技术的目的可以通过以下技术方案来实现:一种基于循环神经网络的图节点分类方法,该方法包括如下步骤:S1、给定一个原始图,构建针对每个节点的中心图;S2、初始化每个中心图节点的初始状态表示向量,同时获取中心图邻接矩阵;S3、以中心图邻接矩阵和初始状态表示向量为输入,节点类型为输出训练基于循环神经网络的分类模型;S4、将原始图邻接矩阵和待分类的节点的初始状态表示向量输入至所述的分类模型得到节点类型。步骤S1具体为:对于给定的一个原始图,针对任意一个给定节点,构建一个围绕该给定节点的中心图,该中心图包括给定节点和与给该节点直接连接的邻居节点的连接状态以及邻居节点间的连接状态。步骤S2具体为:S201、构建原始图的邻接矩阵M,M中第i行第j列元素mij表示图中第i个节点和第j个节点的连接情况,若有边连接则mij为1,没有边连接则mij为0,i=1,2……N,j=1,2……N,N表示原始图中节点总个数;S202、对该邻接矩阵M利用矩阵分解算法降至低维子空间中,得到图的低维矩阵S,矩阵S的第i行记作向量Si,Si为第i个节点的低维表示向量,将Si作为第i个节点的初始状态表示向量;S203、获取每个中心图的中心图邻接矩阵A,A中第p行第q列元素apq表示中心图中第p个节点和第q个节点的连接情况,若有边连接则apq为1,没有边连接则apq为0,p=1,2……C,q=1,2……C,C表示中心图中节点总个数。步骤S3中分类模型包括:门限循环神经网络:以原始图邻接矩阵和各中心图节点的初始状态表示向量为输入,传播每个中心图节点的连接信息,通过T次的传播,得到节点状态表示向量;全连接神经网络:以节点状态表示向量为输入,得到节点特征表示向量;分类器:以节点特征表示向量为输入,得到节点类型。门限循环神经网络通过如下方式构建:针对原始图的第i个节点,以该节点为中心节点构建的中心图包含C个节点,对应的邻接矩阵为Ai,以该中心图作为门限循环网络的输入,具体形式为:对于该中心图中的所有节点,门限循环网络的初始隐藏层状态为该中心图中各节点对应的原始图邻接矩阵低维表示向量:为以原始图中第i个节点为中心节点构建的中心图的第p个节点的初始状态表示向量,赋值为Sip,Sip表示该中心图的第p个节点在原始图的邻接矩降维后得到的对应的低维表示向量;进而,门限循环神经网络初始输入为:当t>1时:t为循环次数,Aip以原始图中第i个节点为中心节点构建的中心图中第p个节点所对应的邻接向量,即Aip为Ai中第p行向量,为以原始图中第i个节点为中心节点构建的中心图中第p个节点在t循环次数后的状态表示向量,Wz、Uz、Wr、Ur、W和U均为门限循环神经网络的训练参数,bA为门限循环神经网络的偏置参数,σ(x)=1+e-x为第一激活函数,tanh(x)=(1+e-2x)/(1-e-2x)为第二激活函数,x为对应激活函数的输入,表示矩阵A和矩阵B的点乘运算:矩阵A和矩阵B中相应位置的元素分别对应相乘并组成新的矩阵。所述的全连接神经网络具体为:其中,vi为原图中第i个节点的特征表示向量,为以原始图中第i个节点为中心节点构建的中心图中对应中心节点的最终状态表示向量,Wv为分类器训练参数,σ为激活函数,bv为分类器偏置向量,σ(x)=1+e-x为第一激活函数,x为激活函数的输入。与现有技术相比,本专利技术具有如下优点:(1)本专利技术基于循环神经网络的分类模型分类准确度高;(2)本专利技术利用邻接矩阵的矩阵分解子空间获得图的全局信息,同时利用中心图的邻接矩阵获得节点的局部信息,门限循环神经网络传播在局部空间中传播信息状态,从而得到图节点的特征表示向量,提高节点分类准确率。附图说明图1为本专利技术基于循环神经网络的图节点分类方法的流程框图;图2为本专利技术中心图的结构示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。注意,以下的实施方式的说明只是实质上的例示,本专利技术并不意在对其适用物或其用途进行限定,且本专利技术并不限定于以下的实施方式。实施例如图1所示,一种基于循环神经网络的图节点分类方法,该方法包括如下步骤:S1、给定一个原始图,构建针对每个节点的中心图;S2、初始化每个中心图节点的初始状态表示向量,同时获取中心图邻接矩阵;S3、以中心图邻接矩阵和初始状态表示向量为输入,节点类型为输出训练基于循环神经网络的分类模型;S4、将原始图邻接矩阵和待分类的节点的初始状态表示向量输入至所述的分类模型得到节点类型。步骤S1具体为:对于给定的一个原始图,针对任意一个给定节点,构建一个围绕该给定节点的中心图,该中心图包括给定节点和与给该节点直接连接的邻居节点的连接状态以及邻居节点间的连接状态。如图2所示为中心图的结构示意图,该图中,vi为中心节点,vi1、vi2、vi3和vi4为vi的邻居节点。以社交网络中的用户分类为例,给定一个社交网络中的数据,将社交网络中的用户看作成图中的节点,则用户之间的关系可以看作一条边,,即用户i与用户j有关系,则节点i和节点j之间有一条边。针对每个节点,构建一个围绕该节点的中心图(EgoNetwork),该中心图包括该节点和与该节点直接连接的邻居节点以及邻居节点间的连接状态。步骤S2具体为:S201、构建原始图的邻接矩阵M,M中第i行第j列元素mij表示图中第i个节点和第j个节点的连接情况,若有边连接则mij为1,没有边连接则mij为0,i=1,2……N,j=1,2……N,N表示原始图中节点总个数;S202、对该邻接矩阵M利用矩阵分解算法降至低维子空间中,得到图的低维矩阵S,矩阵S的第i行记作向量Si,Si为第i个节点的低维表示向量,将Si作为第i个节点的初始状态表示向量;S203、获取每个中心图的中心图邻接矩阵A,A中第p行第q列元素apq表示中心图中第p个节点和第q个节点的连接情况,若有边连接则apq为1,没有边连接则apq为0,p=1,2……C,q=1,2……C,C表示中心图中节点总个数。具体地,针对社交网络,M为原始图的邻接矩阵M,该邻接本文档来自技高网...

【技术保护点】
1.一种基于循环神经网络的图节点分类方法,其特征在于,该方法包括如下步骤:S1、给定一个原始图,构建针对每个节点的中心图;S2、初始化每个中心图节点的初始状态表示向量,同时获取中心图邻接矩阵;S3、以中心图邻接矩阵和初始状态表示向量为输入,节点类型为输出训练基于循环神经网络的分类模型;S4、将原始图邻接矩阵和待分类的节点的初始状态表示向量输入至所述的分类模型得到节点类型。

【技术特征摘要】
1.一种基于循环神经网络的图节点分类方法,其特征在于,该方法包括如下步骤:S1、给定一个原始图,构建针对每个节点的中心图;S2、初始化每个中心图节点的初始状态表示向量,同时获取中心图邻接矩阵;S3、以中心图邻接矩阵和初始状态表示向量为输入,节点类型为输出训练基于循环神经网络的分类模型;S4、将原始图邻接矩阵和待分类的节点的初始状态表示向量输入至所述的分类模型得到节点类型。2.根据权利要求1所述的一种基于循环神经网络的图节点分类方法,其特征在于,步骤S1具体为:对于给定的一个原始图,针对任意一个给定节点,构建一个围绕该给定节点的中心图,该中心图包括给定节点和与给该节点直接连接的邻居节点的连接状态以及邻居节点间的连接状态。3.根据权利要求1所述的一种基于循环神经网络的图节点分类方法,其特征在于,步骤S2具体为:S201、构建原始图的邻接矩阵M,M中第i行第j列元素mij表示图中第i个节点和第j个节点的连接情况,若有边连接则mij为1,没有边连接则mij为0,i=1,2……N,j=1,2……N,N表示原始图中节点总个数;S202、对该邻接矩阵M利用矩阵分解算法降至低维子空间中,得到图的低维矩阵S,矩阵S的第i行记作向量Si,Si为第i个节点的低维表示向量,将Si作为第i个节点的初始状态表示向量;S203、获取每个中心图的中心图邻接矩阵A,A中第p行第q列元素apq表示中心图中第p个节点和第q个节点的连接情况,若有边连接则apq为1,没有边连接则apq为0,p=1,2……C,q=1,2……C,C表示中心图中节点总个数。4.根据权利要求3所述的一种基于循环神经网络的图节点分类方法,其特征在于,步骤S3中分类模型包括:门限循环神经网络:以原始图邻接矩阵和各中心图节点的初始状态表示向量为输入,传播每个中心图节点的连接信息,通过T次的传播,...

【专利技术属性】
技术研发人员:向阳袁书寒陆海
申请(专利权)人:同济大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1