当前位置: 首页 > 专利查询>北京大学专利>正文

图数据强连通分量挖掘方法、装置、设备及存储介质制造方法及图纸

技术编号:31230352 阅读:27 留言:0更新日期:2021-12-08 10:01
本申请公开了一种图数据强连通分量挖掘方法、装置、设备及存储介质,该方法获取包括多个节点的有向图;然后将有向图划分为多个区块图,对各个区块图中节点的第一标签进行异步的标签传播更新,从而大大加快第一标签迭代的速度,并在有向图的全部节点的第一标签更新完成后,将更新前后对应的第一标签相同的节点作为第一子节点,可确定出该有向图中和第一子节点属于同一强连通分量的节点;该方法通过异步的标签传播更新,能够加速第一标签的更新速度,从而减少标签传播过程中所需要的迭代次数,有效提高强连通分量挖掘的效率,有利于减少计算资源的消耗。本申请可广泛应用于大数据技术领域。域。域。

【技术实现步骤摘要】
图数据强连通分量挖掘方法、装置、设备及存储介质


[0001]本申请涉及大数据
,尤其是一种图数据强连通分量挖掘方法、装置、设备及存储介质。

技术介绍

[0002]图作为一种数据结构,广泛存在于自然科学以及社会科学的各个领域。例如,图中各个节点的连通性问题,在电信电力网络、运输系统、计算机程序设计、故障诊断、人工智能、印刷电路板设计、用户分析等场景中经常被考虑、分析和应用到。
[0003]当前,针对节点连通性问题的研究包括挖掘有向图中的强连通分量的任务。相关技术中采用的挖掘算法,单机执行时受到图数据的数据量限制,难以适应大规模的图数据需求;而采用分布式挖掘的算法,往往需要迭代的次数过多,需要耗费大量的硬件资源。综上,相关技术中采用的图数据强连通分量挖掘方式实用性不高,挖掘的效果往往不太理想。

技术实现思路

[0004]本申请的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
[0005]为此,本申请实施例的一个目的在于提供一种图数据强连通分量挖掘方法,该方法能够提高强连通分量挖掘的效率,有利于减少计算本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图数据强连通分量挖掘方法,其特征在于,包括以下步骤:获取有向图;所述有向图中包括多个节点,各个所述节点对应有第一标签,所述第一标签包括第一入度属性值和第一出度属性值;不同的所述节点对应的所述第一入度属性值不同,不同的所述节点对应的所述第一出度属性值不同;将所述有向图划分为多个区块图;对所述有向图中各个节点的所述第一标签进行存储,根据存储的所述第一标签对各个所述区块图中节点的所述第一标签进行异步的标签传播更新,并根据所述标签传播更新的结果更新存储的所述第一标签;当所述有向图中全部节点更新完成后,确定与第一子节点携带有相同第一标签的节点属于同一强连通分量;所述第一子节点为更新前后对应的第一标签相同的节点。2.根据权利要求1所述的方法,其特征在于,所述方法还包括以下步骤:确定所述有向图中的节点对,并将所述节点对合并为一个节点;所述节点对包括第二子节点和第三子节点,所述第二子节点和所述第三子节点存在双向连接关系。3.根据权利要求1所述的方法,其特征在于,所述方法还包括以下步骤:对所述有向图中节点的所述第一入度属性值和所述第一出度属性值进行标签传播更新,得到各个所述节点的第二标签;所述第二标签包括第二入度属性值和第二出度属性值;根据所述第二标签确定并删除所述有向图中的解耦边;所述解耦边两端连接的节点对应的所述第二标签不同。4.根据权利要求1所述的方法,其特征在于,所述对所述有向图中各个节点的所述第一标签进行存储,根据存储的所述第一标签对各个所述区块图中节点的所述第一标签进行异步的标签传播更新,并根据所述标签传播更新的结果更新存储的所述第一标签,包括:将所述有向图中各个所述节点的所述第一入度属性值存储至服务器;通过多个处理单元异步拉取各个所述区块图中节点的所述第一入度属性值以及每个所述节点对应的第三入度属性值;其中,每个所述处理单元处理至少一个所述区块图;所述第三入度属性值为所述节点的入度连接节点的第一入度属性值;在所述处理单元中,通过所述节点对应的所述第三入度属性值更新所述节点的所述第一入度属性值,并将更新后的所述第一入度属性值同步到所述服务器。5.根据权利要求4所述的方法,其特征在于,所述通过所述节点对应的所述第三入度属性值更新所述节点的所述第一入度属性值,包括:确定所述节点对应的所述第一入度属性值和所述第三入度属性值中的最小值或者最大值;将所述最小值或者所述最大值作为所述节点更新后的第一入度属性值。6.根据权利要求1所述的方法,其特征在于,所述对所述有向图中各个节点的所述第一标签进行存储,根据存储的所述第一标签对各个所述区块图中节点的所述第一标签进行异步的标签传播更新,并根据所述标签传播更新的结果更新存储的所述第一标签,包括:将所述有向图中各个所述节点的所述第一出度属性值存储至服务器;通过多个处理单元异步拉取各个所述区块图中节点的所述第一出度属性值以及每个所述节点对应的第三出度属性值;其中,每个所述处理单元处理至少一个所述区块图;所述第三出度属性值为所述节点的出度连接节点的第一出度属性值;在所述处理单元中,通过所述节点对应的所述第三出度属性值更新所述节点的所述第
一出度属性值,并将更新后的所述第一出度属性值同步到所述服务器。7.根据权利要求6所述的方法,其特征在于,所述通过所述节点对应的所述第三出度属性值更新所述节点的所述第一出度属性值,包括:确定...

【专利技术属性】
技术研发人员:李晓森蒋杰高世成欧阳文肖品陶阳宇崔斌
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1