【技术实现步骤摘要】
一种基于图神经网络的知识图谱社区划分方法
[0001]本专利技术属于知识图谱、表示学习、社区发现等领域,涉及一种基于图神经网络的知识图谱社区划分方法。
技术介绍
[0002]社区反映的是网络中的个体行为的局部性特征以及其相互之间的关联关系,研究网络中的社区对理解整个网络的结构和功能起到至关重要的作用,有助于分析及预测整个网络各元素间的交互关系。社区发现能够用来挖掘网络中隐藏的聚簇结构信息,对复杂网络结构与功能的分析具有重要意义,被应用在社交网络、生物网络、交易网络等领域中。
[0003]知识图谱本质上是一种大型的语义网络,旨在描述客观世界的概念实体事件及其关系,它以实体概念为节点,以关系为边,提供一种从关系的视角来看世界,使得海量多样的数据能进行更高效地表达、组织和利用。
[0004]社区发现作为网络科学的经典问题之一,长期受到研究者的广泛关注。Girvan等人提出了GN算法(National Academy of Sciences,2002),该算法求解每条边的介数,然后将介数最大的边删去,再重新求解每条边 ...
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的知识图谱社区划分方法,其特征在于,包括以下步骤:1)构建知识图谱及其邻接矩阵;2)利用图神经网络将知识图谱中的节点进行表示学习,得到节点的向量表示;3)计算节点间的相似度;4)根据同类型的节点间的邻接关系以及节点相似度构建无向有权节点关系网络;5)设置模块度评估社区内部的内聚程度;6)通过社区划分算法将知识图谱中目标节点进行社团划分。2.根据权利要求1所述的基于图神经网络的知识图谱社区划分方法,其特征在于,所述的步骤2)是采用图神经网络GraphSAGE对知识图谱进行表示学习,该网络包括三层,每层都有输入、两次邻居节点的全采样以及卷积聚合的操作,输入为知识图谱的直接邻接矩阵和特征矩阵以及聚合函数,采样以及聚合通过卷积操作学习直接邻接节点和间接邻接节点的信息,三层采样聚合后的输出作为实体的最终向量表示。3.根据权利要求2所述的基于图神经网络的知识图谱社区划分方法,其特征在于,所述的图神经网络中每层进行如下:(1)全采样邻节点的特征对每个中心节点的直接邻节点和2跳邻节点进行采样,学习直接邻节点的特征x
n(v)
以及2跳邻节点节点x
N(v)
的特征,将学习得到的特征嵌入到向量表示中;(2)聚合邻节点的特征聚合中心节点的向量表示及其邻节点的向量表示,得到中心节点的新的向量表示:首先,对中心节点的向量表示进行初始化,向量表示的初始化公式:其中x
v
表示中心节点v的向量表示,为初始输入的向量表示,V为中心节点集合;然后,对中心节点的向量表示及其邻节点的向量表示进行聚合,聚合公式如下:其中N(v)是邻居节点集合,mean表示向量拼接并对向量的每个维度进行求均值的操作,W是权重矩阵;...
【专利技术属性】
技术研发人员:张元鸣,肖士易,肖刚,陆佳炜,程振波,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。