获取关系网络图中节点的嵌入向量的方法和装置制造方法及图纸

技术编号:21571628 阅读:24 留言:0更新日期:2019-07-10 15:26
本说明书实施例提供一种获取关系网络图中节点的嵌入向量的方法和装置,其中所述嵌入向量为预定维度向量,其中,所述关系网络图中包括多个节点及多个节点之间的网络结构,所述多个节点中包括预先确定的第一数量的分散的代表节点,其中,所述第一数量等于所述预定维度数,其中每个代表节点与一个维度相对应,且各个代表节点的嵌入向量中的在该节点对应维度的元素值都恒定等于第一预定值,所述方法包括:对于所述多个节点中的第一节点的嵌入向量中待计算的第一维度的第一元素,获取所述第一节点的相邻邻居节点各自的嵌入向量中的所述第一维度的第二元素的当前值;以及基于所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、及各个所述第二元素的所述当前值,更新所述第一元素的值。

A Method and Device for Obtaining Embedded Vectors of Nodes in Relational Network Graphs

【技术实现步骤摘要】
获取关系网络图中节点的嵌入向量的方法和装置
本说明书实施例涉及计算机信息处理
,更具体地,涉及一种获取关系网络图中节点的嵌入向量的方法和装置。
技术介绍
关系网络图是对现实世界中实体之间的关系的描述,目前广泛地应用于各种计算机信息处理中。一般地,关系网络图包含一个节点集合和一个边集合,节点表示现实世界中的实体,边表示现实世界中实体之间的联系。例如,在社交网络中,人就是实体,人和人之间的关系或联系就是边。在许多情况下,希望将关系网络图中的每个节点(实体)用多维空间中的坐标值来表示,也就是将各个节点映射到一个多维空间中,用多维空间中的点代表图中的节点。多维空间可以是2维、3维空间,也可以是更高维空间。用多维空间的坐标来表达图中的节点,可以应用于计算节点和节点之间的相似度,发现图中的社团结构,预测未来可能形成的边联系,以及对图进行可视化等。将图中的节点映射到多维空间的过程称为图嵌入。图嵌入是一种非常重要的基础技术能力。当前学术界已研究出多种图嵌入方法,如DeepWalk,node2vec,GraphRep等。但由于这些算法内部均采用了蒙特卡洛采样方法,计算效率比较低。当图的规模变得很大时(如支付宝朋友关系网络有5亿以上节点),进行图嵌入计算将耗费巨大的计算资源。因此,希望能有改进的方案,更加快速有效地进行关系网络图的图嵌入过程。
技术实现思路
本说明书实施例旨在提供一种更有效的获取关系网络图中节点的嵌入向量的方案,以解决现有技术中的不足。为实现上述目的,本说明书一个方面提供一种获取关系网络图中节点的嵌入向量的方法,其中所述嵌入向量为预定维度向量,其中,所述关系网络图中包括多个节点及多个节点之间的网络结构,所述多个节点中包括预先确定的第一数量的分散的代表节点,其中,所述第一数量等于所述预定维度数,其中每个代表节点与一个维度相对应,且各个代表节点的嵌入向量中的在该节点对应维度的元素值都恒定等于第一预定值,所述方法包括:对于所述多个节点中的第一节点的嵌入向量中待计算的第一维度的第一元素,获取所述第一节点的相邻邻居节点各自的嵌入向量中的所述第一维度的第二元素的当前值;以及基于所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、及各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,所述第一数量的代表节点为所述多个节点中总邻居节点数最多的第一数量的节点,其中,所述邻居包括相邻的邻居和多阶邻居。在一个实施例中,所述第一数量的代表节点为所述多个节点中预定阶数以内邻居节点数最多的第一数量的节点。在一个实施例中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于预定衰减系数、所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、和各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,所述关系网络图包括多个边,所述边的值表示其连接的相邻节点之间的关系强度,其中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于预定衰减系数、预先获取的第一节点与各相邻邻居节点之间的边值、及各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,第一节点与各相邻邻居节点之间的边值基于所述关系网络图的相邻矩阵获取。在一个实施例中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于预定衰减系数与各个所述第二元素的值的加权和的乘积,更新所述第一元素的值,其中各个所述第二元素的值的权重基于该节点与相应的相邻邻居节点之间的边值获取。在一个实施例中,所述权重等于相应的边值除以各个所述边值之和。在一个实施例中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于所述乘积的常用对数,更新所述第一元素的值。在一个实施例中,所述方法循环多次,其中,在第一次循环进行之前,所述第一元素的值为0,各个所述第二元素的值为所述第一预定值或0。在一个实施例中,所述第一预定值为1。本说明书另一方面提供一种获取关系网络图中节点的嵌入向量的装置,其中所述嵌入向量为预定维度向量,其中,所述关系网络图中包括多个节点及多个节点之间的网络结构,所述多个节点中包括预先确定的第一数量的分散的代表节点,其中,所述第一数量等于所述预定维度数,其中每个代表节点与一个维度相对应,且各个代表节点的嵌入向量中的在该节点对应维度的元素值都恒定等于第一预定值,所述装置包括:获取单元,配置为,对于所述多个节点中的第一节点的嵌入向量中待计算的第一维度的第一元素,获取所述第一节点的相邻邻居节点各自的嵌入向量中的所述第一维度的第二元素的当前值;以及更新单元,配置为,基于所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、及各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,所述更新单元还配置为,基于预定衰减系数、所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、和各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,所述关系网络图包括多个边,所述边的值表示其连接的相邻节点之间的关系强度,所述更新单元还配置为,基于预定衰减系数、预先获取的第一节点与各相邻邻居节点之间的边值、及各个所述第二元素的所述当前值,更新所述第一元素的值。在一个实施例中,所述更新单元还配置为,基于预定衰减系数与各个所述第二元素的值的加权和的乘积,更新所述第一元素的值,其中各个所述第二元素的值的权重基于该节点与相应的相邻邻居节点之间的边值获取。在一个实施例中,所述权重等于相应的边值除以各个所述边值之和。在一个实施例中,所述更新单元还配置为,基于所述乘积的对数,获取所述第一元素的值。本说明书另一方面提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一种方法。本说明书另一方面提供一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述任一种方法。根据本说明实施例的方案可以将超大规模的关系网络/图中的节点表示成一组任意维度(2维,3维等)的坐标值,且每一节点的每一维度坐标值均由该关系网络唯一确定,同时每一节点的每一维度坐标值均有明显和直接的可解释性。附图说明通过结合附图描述本说明书实施例,可以使得本说明书实施例更加清楚:图1为根据本说明书实施例的关系网络图的示意图;图2示出根据本说明书实施例的一种获取关系网络图中节点的嵌入向量的方法流程图;图3示出图G局部图;图4示出通过图嵌入计算获取的二维空间中与各个节点分别对应的各点;图5示出根据本说明书实施例的一种获取关系网络图中节点的嵌入向量的装置500。具体实施方式下面将结合附图描述本说明书实施例。图1为根据本说明书实施例的关系网络图的示意图。如图1所示,该关系网络图包括多个节点,为了清楚起见,图1中为这些节点进行了编号。在这些节点中,具有关联关系的节点之间用边进行连接。在一个例子中,图1中的节点表示社交网络中的人或用户,两个节点之间通过边连接起来,即表示对应的两个用户存在社交上的关联,例如转账、留言、通讯等等。本说明书实施例中的方案可应用于各种包括关系网络图的场景中,尤其适用于包括超大关系网络图的场景,所述场景例如包括推荐营销场景、安全风控场本文档来自技高网...

【技术保护点】
1.一种获取关系网络图中节点的嵌入向量的方法,其中所述嵌入向量为预定维度向量,其中,所述关系网络图中包括多个节点及多个节点之间的网络结构,所述多个节点中包括预先确定的第一数量的分散的代表节点,其中,所述第一数量等于所述预定维度数,其中每个代表节点与一个维度相对应,且各个代表节点的嵌入向量中的在该节点对应维度的元素值都恒定等于第一预定值,所述方法包括:对于所述多个节点中的第一节点的嵌入向量中待计算的第一维度的第一元素,获取所述第一节点的相邻邻居节点各自的嵌入向量中的所述第一维度的第二元素的当前值;以及基于所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、及各个所述第二元素的所述当前值,更新所述第一元素的值。

【技术特征摘要】
1.一种获取关系网络图中节点的嵌入向量的方法,其中所述嵌入向量为预定维度向量,其中,所述关系网络图中包括多个节点及多个节点之间的网络结构,所述多个节点中包括预先确定的第一数量的分散的代表节点,其中,所述第一数量等于所述预定维度数,其中每个代表节点与一个维度相对应,且各个代表节点的嵌入向量中的在该节点对应维度的元素值都恒定等于第一预定值,所述方法包括:对于所述多个节点中的第一节点的嵌入向量中待计算的第一维度的第一元素,获取所述第一节点的相邻邻居节点各自的嵌入向量中的所述第一维度的第二元素的当前值;以及基于所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、及各个所述第二元素的所述当前值,更新所述第一元素的值。2.根据权利要求1所述的方法,其中,所述第一数量的代表节点为所述多个节点中预定阶数以内邻居节点总数最多的第一数量的节点。3.根据权利要求1所述的方法,其中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于预定衰减系数、所述关系网络图中在第一节点与其相邻邻居节点之间的网络结构、和各个所述第二元素的所述当前值,更新所述第一元素的值。4.根据权利要求3所述的方法,其中,所述关系网络图包括多个边,所述边的值表示其连接的相邻节点之间的关系强度,其中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于预定衰减系数、预先获取的第一节点与各相邻邻居节点之间的边值、及各个所述第二元素的所述当前值,更新所述第一元素的值。5.根据权利要求4所述的方法,其中第一节点与各相邻邻居节点之间的边值基于所述关系网络图的相邻矩阵获取。6.根据权利要求4所述的方法,其中,基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于以下两项的乘积更新所述第一元素的值:预定衰减系数、及各个所述第二元素的所述当前值的加权和,其中各个所述第二元素的所述当前值的权重基于该节点与相应的相邻邻居节点之间的边值获取。7.根据权利要求6所述的方法,其中,所述权重等于相应的边值除以各个所述边值之和。8.根据权利要求6所述的方法,其中基于各个所述第二元素的所述当前值,更新所述第一元素的值包括,基于所述乘积的常用对数,更新所述第一元素的值。9.根据权利要求1所述的方法,其中所述方法循环多次,其中,在第一次循环进行之前,所述第一元素的值为0,各个所述第二元素的值为所述第一预定值或0。10.根据权利要求9所述的方法,其中所述第一预定值为1。11.一种获取关系网络图中节点的嵌入向量的装置,其中所述嵌入向量为预定维度向量,其中,所述关系网络图...

【专利技术属性】
技术研发人员:向彪周俊李小龙
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1