增量图划分方法、装置、设备、介质及产品制造方法及图纸

技术编号:37334585 阅读:27 留言:0更新日期:2023-04-21 23:13
本申请公开了一种增量图划分方法、装置、设备、介质及产品,属于数据处理技术领域。该方法包括:在获取到新增数据节点的情况下,确定与新增数据节点存在关联边的至少一个子图;在至少一个子图包括第一子图和第二子图的情况下,获取目标权重增益阈值,新增数据节点与第一子图存在第一关联边,与第二子图存在第二关联边;基于第一关联边和第二关联边的权重值确定权重增量;在权重增量大于目标权重增益阈值的情况下,聚合第一子图与第二子图得到第三子图,并将新增数据节点划分至第三子图。根据本申请实施例,能够改善增量图划分时的划分时间较长,无法满足实时性需求的问题。无法满足实时性需求的问题。无法满足实时性需求的问题。

【技术实现步骤摘要】
增量图划分方法、装置、设备、介质及产品


[0001]本申请属于数据处理
,尤其涉及一种增量图划分方法、装置、设备、介质及产品。

技术介绍

[0002]随着互联网技术的发展应用,目前在风控挖掘分析、营销推荐分析等场景下,均可以利用涉及大量对象的存量数据构建存量图,通过该存量图可以将联系密切的对象归为同一子图,每个子图相当于一个社群,并且可在不同子图之间建立关联边。如此,通过对存量图进行计算分析,可以实现在风控挖掘分析场景下为不同对象评估风险值,在营销推荐分析场景下为不同对象推荐相应营销内容等实际应用。
[0003]相关技术中,当获取到最新增量数据时,通常需要通过全局的图谱算法进行图计算分析,从而完成增量图划分,然而相关技术中增量图划分时的运算量较大,划分时间较长,无法满足实时性需求。

技术实现思路

[0004]本申请实施例提供一种增量图划分方法、装置、设备、介质及产品,能够改善增量图划分时的运算量较大,划分时间较长,无法满足实时性需求的问题。
[0005]第一方面,本申请实施例提供一种增量图划分方法,该方法包括:
[0006]在获取到新增数据节点的情况下,确定N个子图中与新增数据节点存在关联边的至少一个子图,其中,N个子图是基于社区发现算法对存量图进行划分得到的;
[0007]在至少一个子图包括第一子图和第二子图的情况下,获取第一子图和第二子图的目标权重增益阈值,其中,新增数据节点与第一子图存在第一关联边,新增数据节点与第二子图存在第二关联边;
[0008]基于第一关联边和第二关联边的权重值,确定新增数据节点的权重增量;
[0009]在权重增量大于目标权重增益阈值的情况下,确定第一子图与第二子图满足预设聚合条件,聚合第一子图与第二子图,得到第三子图,并将新增数据节点划分至第三子图。
[0010]第二方面,本申请实施例提供一种增量图划分装置,该装置包括:
[0011]确定模块,用于在获取到新增数据节点的情况下,确定N个子图中与新增数据节点存在关联边的至少一个子图,其中,N个子图是基于社区发现算法对存量图进行划分得到的;
[0012]获取模块,用于在至少一个子图包括第一子图和第二子图的情况下,获取第一子图和第二子图的目标权重增益阈值,其中,新增数据节点与第一子图存在第一关联边,新增数据节点与第二子图存在第二关联边;
[0013]确定模块,还用于基于第一关联边和第二关联边的权重值,确定新增数据节点的权重增量;
[0014]划分模块,用于在权重增量大于目标权重增益阈值的情况下,确定第一子图与第
二子图满足预设聚合条件,聚合第一子图与第二子图,得到第三子图,并将新增数据节点划分至第三子图。
[0015]第三方面,本申请实施例提供一种电子设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面所示的增量图划分方法的步骤。
[0016]第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面所示的增量图划分方法的步骤。
[0017]第五方面,本申请实施例提供一种计算机程序产品,计算机程序产品被存储在非易失的存储介质中,计算机程序产品被至少一个处理器执行时实现如第一方面所示的增量图划分方法的步骤。
[0018]第六方面,本申请实施例提供一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的增量图划分方法的步骤。
[0019]本申请实施例提供一种增量图划分方法、装置、设备、介质及产品,基于社区发现算法预先对存量图进行划分得到N个子图,在获取到新增数据节点的情况下,确定N个子图中与新增数据节点存在关联边的至少一个子图,若至少一个子图包括第一子图和第二子图,说明该新增数据节点与不止一个社群中的社群节点具有关联关系。基于此,本申请获取第一子图和第二子图的目标权重增益阈值,并基于新增数据节点与两个子图之间的关联边的权重值,确定新增数据节点的权重增量。若该权重增量大于目标权重增益阈值,则可以说明在第一子图与第二子图之间添加新增数据节点之后,该权重增量能够使得第一子图与第二子图之间的模块度增益得以提升,进而使得第一子图与第二子图满足预设聚合条件。如此,通过聚合第一子图与第二子图,能够得到受新增数据节点影响的第三子图,通过遍历每个新增数据节点,即可将N个子图中所有满足预设聚合条件的子图进行两两融合,实现对原有存量图的图结构的重新划分,且整个划分过程无需涉及大量运算,仅需预先离线计算目标权重增益阈值即可,在获取到新增数据节点的场景下可以完成增量图的实时划分,满足实时性需求。
附图说明
[0020]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1为本申请第一方面提供的增量图划分方法的一实施例的流程图;
[0022]图2为本申请第一方面提供的存量图的示例的示意图;
[0023]图3为本申请第一方面提供的增量图划分效果的示例的示意图;
[0024]图4为本申请第一方面提供的增量图划分方法的另一实施例的流程图;
[0025]图5为本申请第一方面提供的增量图划分方法的再一实施例的流程图;
[0026]图6为本申请第一方面提供的存量图的另一示例的示意图;
[0027]图7为本申请第一方面提供的存量图的再一示例的示意图;
[0028]图8为本申请第一方面提供的增量图划分效果的另一示例的示意图;
[0029]图9为本申请第一方面提供的增量图划分效果的再一示例的示意图;
[0030]图10为本申请第一方面提供的增量图划分效果的再一示例的示意图;
[0031]图11为本申请第二方面提供的增量图划分装置的一实施例的结构示意图;
[0032]图12为本申请第三方面提供的电子设备的一实施例的结构示意图。
具体实施方式
[0033]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0034]随着互联网技术的发展应用,目前在风控挖掘分析、营销推荐分析等场景下,均可以利用涉及大量对象的存量数据构建存量图,通过该存量图可以将联系密切的对象归为同一子图,每个子图相当于一个社群,并且可在不同子图之间建立关联边。如此,通过对存量图进行计算分析,可以实现在风控挖掘分析场景下为不同对象评估风险值,在营销推荐分析场景下为不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种增量图划分方法,其特征在于,所述方法包括:在获取到新增数据节点的情况下,确定N个子图中与所述新增数据节点存在关联边的至少一个子图,其中,所述N个子图是基于社区发现算法对存量图进行划分得到的;在所述至少一个子图包括第一子图和第二子图的情况下,获取所述第一子图和所述第二子图的目标权重增益阈值,其中,所述新增数据节点与所述第一子图存在第一关联边,所述新增数据节点与所述第二子图存在第二关联边;基于所述第一关联边和所述第二关联边的权重值,确定所述新增数据节点的权重增量;在所述权重增量大于所述目标权重增益阈值的情况下,确定所述第一子图与所述第二子图满足预设聚合条件,聚合所述第一子图与所述第二子图,得到第三子图,并将所述新增数据节点划分至所述第三子图。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述至少一个子图包括第一子图和第二子图的情况下,获取所述第一子图和所述第二子图的模块度增益;基于所述第一关联边和所述第二关联边的权重值,以及社区发现算法,对所述模块度增益进行更新,得到更新后的模块度增益。3.根据权利要求2所述的方法,其特征在于,在所述权重增量大于所述目标权重增益阈值的情况下,确定所述第一子图与所述第二子图之间的关联度满足预设聚合条件,包括:在所述权重增量大于所述目标权重增益阈值的情况下,确定所述更新后的模块度增益大于零;在所述更新后的模块度增益大于零的情况下,确定所述第一子图与所述第二子图满足预设聚合条件。4.根据权利要求1所述的方法,其特征在于,所述第一关联边对应第一权重,所述第二关联边对应第二权重,所述基于所述第一关联边和所述第二关联边的权重值,确定所述新增数据节点的权重增量,包括:将所述第一权重与所述第二权重相加,得到第一和值;计算所述第一和值与预设归一化变量的比值,得到权重增量。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述权重增量不大于所述目标权重增益的情况下,比较所述第一权重和所述第二权重;若所述第一权重大于所述第二权重,则将所述新增数据节点划分至所述第一子图;若所述第二权重大于所述第一权重,则将所述新增数据节点划分至所述第二子图。6.根据权利要求1所述的方法,其特征在于,所述第一子图与M1个子图存在关联边,所述第二子图与M2个子图存在关联边,所述M1个子图中包括所述第二子图,所述M2个子图中包括所述第一子图,在所述获取所述第一子图和所述第二子图的目标权重增益阈值之前,所述方法还包括:获取所述第一子图与M1个子图之间关联边的权重,得到M1个第三权重;获取所述第二子图与M2个子图之间关联边的权重,得到M2个第四权重;基于所述M1个第三权重、所述M2个第四权重,以及第五权重,计算所述第一子图和第二
子图的目标权重增益阈值;其中,所述第五权重为所述第一子图与所述第二子图之间关联边的权重。7.根据权利要求6所述的方法,其特征在于,所述基于所述M1个第三权重、所...

【专利技术属性】
技术研发人员:汤韬高鹏飞孙权潘婧赵金涛郑建宾艾博轩庞悦
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1