【技术实现步骤摘要】
图数据处理方法、装置、计算设备、存储介质和程序产品
[0001]本申请涉及计算机
,具体涉及一种图数据处理方法、图数据处理装置、计算设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]随着计算机网络的不断普及和发展,人们越来越多地参与到各种网络关系中,例如社交网络、金融交易网络、车联网等。典型地,可以使用图(Graph)来描述这些网络关系。具体而言,图中的节点可以对应于网络关系中的各个参与方,边可以对应于不同参与方之间存在的网络关联,例如,在社交网络中,边可以对应于不同参与方之间的好友关系、通信关系等,或者,在金融交易网络中,边可以对应于不同参与方之间的支付或转账关系等。再例如,在车联网中,边可以对应于不同车辆之间的距离、速度、方位关系。
[0003]在一些情境中,人们可能对与一个或多个参与方直接或间接存在网络关联的参与方的数目感兴趣,例如以便监控该一个或多个参与方是否存在异常活动等。这可以通过统计图中对应节点的某个邻域内的不重复的节点的数目来确定。然而,在当前大多数网络关系中,往往存在巨大数量的 ...
【技术保护点】
【技术特征摘要】
1.一种图数据处理方法,其特征在于,包括:获取有向图数据,所述有向图数据包括与多个节点相关的多项边数据,其中每项边数据表示一条从源节点指向尾节点的边,并包括相应的源节点标识和尾节点标识;基于所获取的有向图数据,在参数服务器上为每个节点创建相关联的基数计数器,每个基数计数器被配置为基于被添加至该基数计数器的节点标识来确定基数估算值;基于每个节点的节点信息初始化与该节点相关联的基数计数器,所述节点信息包括节点标识;迭代更新所述基数计数器,直至达到期望迭代轮次数,在每轮次迭代中执行以下迭代操作:针对每个源节点,从所述参数服务器获取与该源节点相关联的基数计数器,并将所获取的基数计数器传送至与该源节点相关的所有尾节点;针对每个尾节点,基于所接收的来自该尾节点的所有相关源节点的基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器;基于迭代更新后的基数计数器,确定所述多个节点中的至少一个节点的期望阶数的邻域内的节点数量,其中所述期望阶数与所述期望迭代轮次数相等。2.根据权利要求1所述的方法,其中,所述获取有向图数据包括:接收无向图数据,所述无向图数据包括与多个节点相关的多项边数据,其中每项边数据表示一条连接两个节点的边,并包括相应的两个节点标识;基于所述无向图数据中的每项边数据,交换两个节点标识的位置,以生成附加边数据;将所述无向图数据中的多项边数据和所生成的多项附加边数据的组合作为所述有向图数据。3.根据权利要求1所述的方法,其中,所述节点信息还包括节点标签,并且其中,所述基于每个节点的节点信息初始化相关联的基数计数器包括:当该节点的节点标签属于目标标签时,将该节点的节点标识添加至相关联的基数计数器,以便将该基数计数器的基数估算值初始化为1;当该节点的节点标签不属于目标标签时,不将该节点的节点标识添加至相关联的基数计数器,以便将该基数计数器的基数估算值初始化为0。4.根据权利要求1
‑
3中任一项所述的方法,其中,所述基于所接收的来自所有相关源节点的基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器包括:对所接收的来自所有相关源节点的基数计数器进行去重合并,以生成更新基数计数器;基于所生成的更新基数计数器更新所述参数服务器上的与该尾节点相关联的基数计数器。5.根据权利要求4所述的方法,其中,所述基于所生成的更新基数计数器更新所述参数服务器上的与该节点相关联的基数计数器包括:将所生成的更新基数计数器推送至所述参数服务器,其中,所述参数服务器被配置为在接收到更新基数计数器后,对与同一节点相关联的更新基数计数器和基数计数器进行去重合并,以作为更新后的基数计数器。6.根据权利要求1
‑
3中任一项所述的方法,还包括:针对所述有向图数据,基于源节点标识,对具有相同源节点的尾节点进行聚合,以得到
与每个源节点对应的尾节点集合,并且其中,所述将所获取的基数计数器传送至与该源节点相关的所有尾节点包括:将所获取的基数计数器传送至与该源节点对应的尾节点集合中的所有尾节点。7.根据权利要求1
‑
3中任一项所述的方法,还包括:将所述有向图数据划分为多组图数据;其中,在每轮次迭代中执行...
【专利技术属性】
技术研发人员:王贺雨,蒋杰,李晓森,欧阳文,肖品,陶阳宇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。