为二分图中的节点分配嵌入向量的方法以及装置制造方法及图纸

技术编号:24205561 阅读:19 留言:0更新日期:2020-05-20 14:30
本申请公开了一种为二分图中的节点分配嵌入向量的方法、装置、电子设备以及计算机可读存储介质,涉及图处理技术领域。本申请在为二分图中的节点分配嵌入向量时的实现方案为:获取待处理二分图;确定所述待处理二分图中的少数类节点以及多数类节点;为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。本申请能够提升嵌入向量的分配效率,降低嵌入向量所占用的内存资源。

A method and device for assigning embedding vectors to nodes in Bipartite Graphs

【技术实现步骤摘要】
为二分图中的节点分配嵌入向量的方法以及装置
本申请涉及数据处理
,尤其涉及图处理
中的一种为二分图中的节点分配嵌入向量的方法、装置、电子设备以及计算机可读存储介质。
技术介绍
现有技术中,在为二分图中的节点分配嵌入向量时,通常是对二分图中的各节点分配对应各自的嵌入向量。因此,当所要处理的二分图的数量非常多时,分配各二分图中的全部节点的嵌入向量需要耗费较多大量时间,且对各节点的嵌入向量进行保存时需要占用较大的内存资源。
技术实现思路
本申请为解决技术问题所采用的技术方案是提供一种为二分图中的节点分配嵌入向量的方法、装置、电子设备以及计算机可读介质,所述方法包括:获取待处理二分图;确定所述待处理二分图中的少数类节点以及多数类节点;为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。本申请能够提升嵌入向量的分配效率,降低嵌入向量所占用的内存资源。根据本申请一优选实施例,所述确定所述待处理二分图中的少数类节点以及多数类节点包括:分别获取所述待处理二分图中两个节点集合所包含节点的数量;将节点数量较少的节点集合中的各节点作为少数类节点,将另一节点集合中的各节点作为多数类节点。本步骤能够提升节点划分的准确性。根据本申请一优选实施例,所述方法还包括:确定与各多数类节点具有连接关系的邻居节点;将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接,将拼接结果作为对应该多数类节点的嵌入向量。本步骤在无需为多数类节点预先分配嵌入向量的情况下,能够利用已知的节点之间的连接关系和少数类节点的嵌入向量来获取多数类节点的嵌入向量。根据本申请一优选实施例,所述将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接包括:获取各邻居节点对应的嵌入向量;将各邻居节点对应的嵌入向量与所述共享的嵌入向量进行拼接。本申请为解决技术问题所采用的技术方案是提供一种为二分图中的节点分配嵌入向量的装置,包括:获取单元,用于获取待处理二分图;确定单元,用于确定所述待处理二分图中的少数类节点以及多数类节点;分配单元,用于为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。根据本申请一优选实施例,所述确定单元在确定所述待处理二分图中的少数类节点以及多数类节点时,具体执行:分别获取所述待处理二分图中两个节点集合所包含节点的数量;将节点数量较少的节点集合中的各节点作为少数类节点,将另一节点集合中的各节点作为多数类节点。根据本申请一优选实施例,所述分配单元还执行:确定与各多数类节点具有连接关系的邻居节点;将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接,将拼接结果作为对应该多数类节点的嵌入向量。根据本申请一优选实施例,所述分配单元在将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接时,具体执行:获取各邻居节点对应的嵌入向量;将各邻居节点对应的嵌入向量与所述共享的嵌入向量进行拼接。上述申请中的一个实施例具有如下优点或有益效果:本申请能够提升嵌入向量的分配效率,降低为节点所分配的嵌入向量占用的内存资源。因为采用了只对二分图中的部分节点分配各自所对应的嵌入向量的方式,所以克服了现有技术中对全部节点分配各自所对应的嵌入向量所导致的分配效率低、内存资源占用大的技术问题,达到提升嵌入向量的分配效率、降低嵌入向量所占用的内存资源的技术效果。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例提供的一种为二分图中的节点分配嵌入向量的方法流程图;图2是根据本申请第二实施例提供的一种为二分图中的节点分配嵌入向量的示意图;图3是根据本申请第三实施例提供的一种为二分图中的节点分配嵌入向量的装置结构图;图4是用来实现本申请实施例的为二分图中的节点分配嵌入向量的方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1为本申请一实施例提供的一种为二分图中的节点分配嵌入向量的方法流程图,如图1中所示,所述方法包括:在S101中,获取待处理二分图。在本步骤中,获取待处理二分图。其中,本步骤所获取的待处理二分图可以对应不同的应用场景,例如对应推广信息推荐的二分图、对应多媒体信息推荐的二分图、对应物品推荐的二分图等。可以理解的是,本步骤所获取的待处理二分图中包含两个节点集合,每个节点集合中包含有至少一个节点,还包含属于不同节点集合中的各节点之间的连接关系。举例来说,若本步骤所获取的待处理二分图为对应推广信息推荐的二分图,则该二分图中包含用户节点集合以及推广信息节点集合,还包含各用户节点与各推广信息节点之间的连接关系。在S102中,确定所述待处理二分图中的少数类节点以及多数类节点。在本步骤中,确定步骤S101所获取的待处理二分图中的少数类节点以及多数类节点。也就是说,本步骤将待处理二分图中的两个节点集合进一步划分为两个类别,从而将待处理二分图中所包含的各节点分别划分为少数类节点以及多数类节点。可以理解的是,在一些推荐场景中,待推荐对象的数量通常比较稳定,并且远低于用户的数量。因此,本步骤在确定待处理二分图中的少数类节点以及多数类节点时,可以根据各节点的标识信息,来直接将各节点划分为少数类节点以及多数类节点,从而提升节点划分的速度。举例来说,本步骤可以将待处理二分图中的各用户节点作为多数类节点,而将待处理二分图中剩余的各节点作为少数类节点。而为了能够提升节点划分的准确性,本步骤在确定待处理二分图中的少数类节点以及多数类节点时,还可以采用以下方式:分别获取待处理二分图中两个节点集合所包含节点的数量;将节点数量较少的节点集合中的各节点作为少数类节点,将另一节点集合中的各节点作为多数类节点。也就是说,本步骤通过节点数量来进一步划分两个节点集合的类别,从而更加准确地获取待处理二分图中的少数类节点以及多数类节点。在S103中,为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。在本步骤中,为步骤S102所确定的各少数类节点分配对应各自的嵌入向量,为步骤S102所确定的各多数类节点分配一个共享的嵌入向量,从而完成对待处理二分图中各节点的嵌入向量分配。也就是说,本步骤中不同的少数类节点对应不同的嵌入向量,而不同的多数类节点则对应一个相同的嵌入向量。其中,本步骤中节点的嵌入向量对应节点的属性特征,即以向量的形式来表示节点的特征信息本文档来自技高网...

【技术保护点】
1.一种为二分图中的节点分配嵌入向量的方法,其特征在于,包括:/n获取待处理二分图;/n确定所述待处理二分图中的少数类节点以及多数类节点;/n为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。/n

【技术特征摘要】
1.一种为二分图中的节点分配嵌入向量的方法,其特征在于,包括:
获取待处理二分图;
确定所述待处理二分图中的少数类节点以及多数类节点;
为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。


2.根据权利要求1所述的方法,其特征在于,所述确定所述待处理二分图中的少数类节点以及多数类节点包括:
分别获取所述待处理二分图中两个节点集合所包含节点的数量;
将节点数量较少的节点集合中的各节点作为少数类节点,将另一节点集合中的各节点作为多数类节点。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定与各多数类节点具有连接关系的邻居节点;
将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接,将拼接结果作为对应该多数类节点的嵌入向量。


4.根据权利要求3所述的方法,其特征在于,所述将对应同一个多数类节点的各邻居节点对应的嵌入向量进行拼接包括:
获取各邻居节点对应的嵌入向量;
将各邻居节点对应的嵌入向量与所述共享的嵌入向量进行拼接。


5.一种为二分图中的节点分配嵌入向量的装置,其特征在于,包括:
获取单元,用于获取待处理二分图;
确定单元,用于确定所述待处理二分图中的少数类节点以及多数类节点;
分配单元,用于为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个...

【专利技术属性】
技术研发人员:苏炜跃冯仕堃朱志凡何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1