集群识别方法和装置、计算设备、存储介质及程序产品制造方法及图纸

技术编号:38896935 阅读:8 留言:0更新日期:2023-09-22 14:18
本申请公开了一种集群识别方法,包括:获取第一资源系统中多个主体的资源转移数据,其中资源转移数据包括多个主体中的每个主体的资源接收数据和资源支出数据;基于多个主体的资源转移数据,从多个主体中确定候选主体,候选主体的资源接收数据与不同于第一资源系统的第二资源系统相关,并且候选主体的资源支出数据与不同于第一资源系统的第三资源系统相关,其中第二资源系统用于向第一资源系统中的候选主体支出资源,第三资源系统用于从第一资源系统中的候选主体接收资源;根据候选主体的资源接收数据和资源支出数据,确定候选主体中每个主体的资源转移水平;至少根据候选主体中每个主体的资源转移水平,从候选主体中识别目标集群,目标集群包括从第二资源系统经由第一资源系统到第三资源系统的资源转移过程所涉及的至少一个候选主体。及的至少一个候选主体。及的至少一个候选主体。

【技术实现步骤摘要】
集群识别方法和装置、计算设备、存储介质及程序产品


[0001]本申请涉及互联网
,特别涉及一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]互联网技术的迅速发展为资源的转移和流通提供了新的方式。日常的资源交易中,有可能夹杂着非正常或异常资源转移活动,而参与异常资源转移活动的往往是多个主体的构成的集群,可以被称为异常集群,其中单个主体可以称为异常主体。在相关技术中,识别异常集群的方法包括预先确定从事异常资源转移活动的单个主体的交易特征,根据这些交易特征开发识别模型或者训练机器学习模型,以便利用上述模型确定待识别资源转移主体是否为从事异常资源转移活动的可疑主体;另外还包括使用现有算法或模型来对主体进行分类或分群,从而确定可疑主体集群。
[0003]相关技术的异常集群识别方法往往以单个主体的交易特征为核心,而忽略了参与异常资源转移活动的集群中各个主体的相互关联以及不同资源系统之间的资源转移过程,这导致集群识别的思路存在片面性和局限性,无法准确地挖掘潜在的异常集群,漏判率和/或误判率较大。

技术实现思路

[0004]鉴于此,本申请提供了一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品,期望缓解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。
[0005]根据本申请的一个方面,提供了一种集群识别方法,该方法包括:获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。
[0006]在根据本申请的一些实施例的集群识别方法中,至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:以所述候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据所述节点和所述节点之间的有向边建立资源转移多分有向图,所述资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,所述节点的层级指示该节点与所述第二资源系统
或所述第三资源系统的相关程度;至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,其中所述每个节点的属性值指示该节点属于目标集群的可能性;基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群。
[0007]在根据本申请的一些实施例的集群识别方法中,每个节点的资源转移水平包括每个节点的资源转移留存值,所述每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。
[0008]在根据本申请的一些实施例的集群识别方法中,每个节点的资源转移水平进一步包括每个节点的资源收支最小值,所述每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。
[0009]在根据本申请的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:与所述节点的资源转移留存值成负相关;与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及与所述节点的资源收支最小值成正相关。
[0010]在根据本申请的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,包括:对于所述资源转移多分有向图中的每个节点,使用下述公式确定所述节点的属性值:其中表示资源转移多分有向图S中节点i的属性值,表示节点i的资源支出总量和资源接收总量中的较小者,表示节点i的资源支出总量和资源接收总量中的较大者,表示节点i的第一类型层级和第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。
[0011]在根据本申请的一些实施例的集群识别方法中,基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群,包括:将所述资源转移多分有向图中的各个节点的集合作为当前候选集群,通过迭代方式依次执行下述步骤,以获取候选集群集合:迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群;当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点并更新所移除的节点的相邻节点的属性值,以更新当前候选集群,并转到迭代结束判定步骤,以及基于候选集群集合中各候选集群的集群特征值,从候选集群集合中识别目标集群。
[0012]在根据本申请的一些实施例的集群识别方法中,获取第一资源系统中多个主体的
资源转移数据包括:获取预设时间段内多个主体的资源转移数据。
[0013]在根据本申请的一些实施例的集群识别方法中,预设时间段的长度大于或等于3个小时。
[0014]在根据本申请的一些实施例的集群识别方法中,基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,包括:基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合;基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合;根据第一主体集合和第二主体集合的交集确定候选主体。
[0015]在根据本申请的一些实施例的集群识别方法中,基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合,包括:基于所述多个主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在直接资源转移关系的直接接收主体;根据直接接收主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在间接资源转移关系的间接接收主体;基于直接接收主体和间接接收主体,确定第一主体集合,并且/或者基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合,包括:基于所述多个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集群识别方法,包括:获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。2.根据权利要求1所述的方法,其中,所述至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:以所述候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据所述节点和所述节点之间的有向边建立资源转移多分有向图,所述资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,所述节点的层级指示该节点与所述第二资源系统或所述第三资源系统的相关程度;至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,其中所述每个节点的属性值指示该节点属于目标集群的可能性;基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群。3.根据权利要求2所述的方法,其中所述每个节点的资源转移水平包括每个节点的资源转移留存值,所述每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。4. 根据权利要求3所述的方法,所述每个节点的资源转移水平进一步包括每个节点的资源收支最小值,所述每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。5.根据权利要求4所述的方法,其中所述节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且所述资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:与所述节点的资源转移留存值成负相关;与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及与所述节点的资源收支最小值成正相关。6.根据权利要求2所述的方法,其中所述节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且所述至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述
资源转移多分有向图中每个节点的属性值,包括:对于所述资源转移多分有向图中的每个节点,使用下述公式确定所述节点的属性值:其中表示资源转移多分有向图S中节点i的属性值,表示节点i的资源支出总量和资源接收总量中的较小者,表示节点i的资源支出总量和资源接收总量中的较大者,表示节点i的第一类型层级和第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。7.根据权利要求2所述的方法,其中所述基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群,包括:将所述资源转移多分有向图中的各个节点的集合作为当前候选集群,通过迭代方式依次执行下述步骤,以获取候选集群集合:迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群;当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点...

【专利技术属性】
技术研发人员:张密
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1