【技术实现步骤摘要】
图数据处理方法、装置、计算机设备及存储介质
[0001]本申请涉及计算机
,特别涉及一种图数据处理方法、装置、计算机设备及存储介质。
技术介绍
[0002]图嵌入技术已成为大规模图数据挖掘的一种有效技术手段。图嵌入的主要思想是将高维稀疏的原始图数据,映射成低维度稠密的向量,即图中每个节点的嵌入向量,从而在嵌入空间中尽可能地保留图的拓扑结构信息。如何高效的对图数据进行图嵌入是一个研究方向。
[0003]目前,常用的图嵌入技术有DeepWalk(深度游走)、Node2Vec(节点到向量)、LINE(Large
‑
scale Information Network Embedding,大规模信息网络嵌入)等,基于随机游走算法来确定图数据中的节点和节点之间的业务关系,最后每个节点的编码向量。
[0004]然而,对于有向图来说,有向图中的一对节点分别表示业务关系的发起者和接收者,该对节点之间的有向边从发起者指向接收者,但是上述三种算法最终得到的都是图中每个节点对应的一个编码向量,既不能表示节点的 ...
【技术保护点】
【技术特征摘要】
1.一种图数据处理方法,其特征在于,所述方法包括:基于对象数据,获取目标图,所述目标图包括表示对象的M个节点,M为正整数,所述目标图中的有向边用于表示所连接的节点对应的对象之间存在业务关系,且所述有向边的指出节点为所述业务关系的发起者,所述有向边的指向节点为所述业务关系的接收者;基于所述M个节点和所述M个节点之间的有向边进行多轮迭代,得到所述M个节点对应的发起嵌入特征和接收嵌入特征,所述发起嵌入特征用于表示对应的节点作为发起者的特征,所述接收嵌入特征用于表示对应的节点作为接收者的特征;其中,第z轮迭代的步骤包括:从所述M个节点中获取N个节点,N为正整数,z为正整数;基于所述N个节点关联的有向边,确定所述N个节点关联的多个第一邻域节点以及所述N个节点关联的多个第二邻域节点,所述第一邻域节点指出的有向边指向所述N个节点,所述N个节点指出的有向边指向所述多个第二邻域节点;基于所述N个节点的第一嵌入特征、所述多个第一邻域节点的第二嵌入特征以及所述多个第二邻域节点的第三嵌入特征,确定所述N个节点的第四嵌入特征。2.根据权利要求1所述的方法,其特征在于,所述基于所述N个节点的第一嵌入特征、所述多个第一邻域节点的第二嵌入特征以及所述多个第二邻域节点的第三嵌入特征,确定所述N个节点的第四嵌入特征,包括:基于所述N个节点的第一嵌入特征、所述多个第一邻域节点的第二嵌入特征、节点入度分布信息以及多个第一节点的第五嵌入特征,确定第一函数,所述节点入度分布信息用于表示所述N个节点的节点入度的分布,所述多个第一节点基于所述N个节点的第一邻域负采样得到,所述第一邻域包括所述多个第一邻域节点;基于所述N个节点的第一嵌入特征、所述多个第二邻域节点的第三嵌入特征、节点出度分布信息以及多个第二节点的第六嵌入特征,确定第二函数,所述节点出度分布信息用于表示所述N个节点的节点出度的分布,所述多个第二节点基于所述N个节点的第二邻域负采样得到,所述第二邻域包括所述多个第二邻域节点;对基于所述第一函数和所述第二函数构成的第一目标函数进行优化,得到所述N个节点的第四嵌入特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述N个节点的第一嵌入特征、所述多个第一邻域节点的第二嵌入特征、节点入度分布信息以及多个第一节点的第五嵌入特征,确定第一函数,包括:从所述N个节点的第一嵌入特征中,获取N个第一中间嵌入特征,所述N个第一中间嵌入特征用于表示所述N个节点作为所述接收者的特征;从所述多个第一邻域节点的第二嵌入特征中,获取多个第二中间嵌入特征,所述多个第二中间嵌入特征用于表示所述多个第一邻域节点作为所述发起者的特征;基于所述节点入度分布信息,确定第一期望信息,所述第一期望信息用于表示所述多个第一节点满足所述节点入度分布信息的数学期望;从所述多个第一节点的第五嵌入特征中,获取多个第三中间嵌入特征,所述多第三中间嵌入特征用于表示所述多个第一节点作为所述发起者的特征;基于所述N个第一中间嵌入特征、所述多个第二中间嵌入特征、所述第一期望信息以及
所述多个第三中间嵌入特征,确定所述第一函数。4.根据权利要求2所述的方法,其特征在于,所述基于所述N个节点的第一嵌入特征、所述多个第二邻域节点的第三嵌入特征、节点出度分布信息以及多个第二节点的第六嵌入特征,确定第二函数,包括:从所述N个节点的第一嵌入特征中,获取N个第四中间嵌入特征,所述N个第四中间嵌入特征用于表示所述N个节点作为所述发起者的特征;从所述多个第二邻域节点的第三嵌入特征中,获取多个第五中间嵌入特征,所述多个第五中间嵌入特征用于表示所述多个第二邻域节点作为所述接收者的特征;基于所述节点出度分布信息,确定第二期望信息,所述第二期望信息用于表示所述多个第二节点满足所述节点出度分布信息的数学期望;从所述多个第二节点的嵌入特征中,获取多个第六中间嵌入特征,所述多个第六中间嵌入特征用于表示所述多个第二节点作为所述接收者的特征;基于所述N个第四中间嵌入特征、所述多个第五中间嵌入特征、所述第二期望信息以及所述多个第六中间嵌入特征,确定所述第二函数。5.根据权利要求1所述的方法,其特征在于,所述基于所述N个节点的第一嵌入特征、所述多个第一邻域节点的第二嵌入特征以及所述多个第二邻域节点的第三嵌入特征,确定所述N个节点的第四嵌入特征,包括:基于所述N个节点的第一嵌入特征和所述多个第一邻域节点的第二嵌入特征,确定第一概率信息,所述第一概率信息用于指示基于所述N个节点确定所述多个第一邻域节点的概率;基于所述N个节点的第一嵌入特征和所述多个第二邻域节点的第三嵌入特征,确定第二概率信息,所述第二概率信息用于指示基于所述N个节点确定所述多个第二邻域节点的概率;基于所述第一概率信息和所述第二概率信息,确定...
【专利技术属性】
技术研发人员:王志涛,洪立涛,黄薇屹,苏函晶,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。