团伙挖掘方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:37582654 阅读:21 留言:0更新日期:2023-05-15 07:56
本申请提供了一种团伙挖掘方法、装置、电子设备及计算机可读存储介质;所述方法包括:根据用户在不同时间的交易的行为特征,获取所述用户的第一序列向量;将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组;将所述每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙;其中,所述第一分组处理的分组粒度大于所述第二分组处理的分组粒度。本申请提供的团伙挖掘方法可以提高团伙挖掘的效率和准确率。准确率。准确率。

【技术实现步骤摘要】
团伙挖掘方法、装置、电子设备及计算机可读存储介质


[0001]本申请涉及人工智能
,尤其涉及一种团伙挖掘方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前,银行行业应对异常交易的风控方法主要根据账号的消费行为记录和交易特征,依靠业务专家进行人工审核或构建专家规则进行识别。其中,通过业务专家直接进行人工审核的方式,由于不同专家的评判标准不同,审核结果的主观性较大,审核结果的稳定较差;同时,人工审核效率会随着审核量的提升而下降,完全不适应于当下电子或电子银行大规模记录的业务场景需求。构建专家规则进行审核的方式,由于现阶段风险团伙作案更加多样化,单一且固定的专家规则越来越难以应对风险团伙各种的异常交易模式,会造成比较大的漏报率。
[0003]因此,如何实现一种可应用于风控场景中的分阶段的高维向量相似度聚类算法框架,在数据量大、向量维度高的情况下,能够大幅提高现有聚类算法的性能,有效解决银行风控场景中的团伙挖掘需求,是本申请亟待解决的技术问题。

技术实现思路

[0004]本申请实施例提供一种团伙挖掘方法、装置、电子设备及计算机可读存储介质,可以在风控场景中数据量大、向量维度高的情况下,提高团伙挖掘的效率和准确率。
[0005]本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种团伙挖掘方法,包括:根据用户在不同时间的交易的行为特征,获取所述用户的第一序列向量;将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组;将所述每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙;其中,所述第一分组处理的分组粒度大于所述第二分组处理的分组粒度。
[0006]在上述方案中,所述将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组,包括:将所述第一序列向量按照第一时间划分为第一数量的第一子向量,所述第一数量为正整数;基于所述第一子向量对应的行为特征,对所述第一序列向量进行降维处理,得到所述第二序列向量;对所述第二序列向量进行聚类处理,得到所述每个分组。
[0007]在上述方案中,所述基于所述第一子向量对应的行为特征,对所述第一序列向量进行降维处理,得到第二序列向量,包括:针对每个第一子向量,根据所述第一子向量对应的所述行为特征确定所述第一子
向量对应的活跃值;基于所述活跃值确定所述第一子向量在降维后对应的值;基于所述第一子向量在降维后对应的值,确定所述第二序列向量。
[0008]在上述方案中,所述基于所述活跃值确定所述第一子向量在降维后对应的值,包括:若所述活跃值大于或者等于预设的活跃阈值,则将所述第一子向量在降维后对应的值确定为第一数值;若所述活跃值小于所述活跃阈值,则将所述第一子向量在降维后对应的值确定为第二数值;所述第一数值与所述第二数值不相等。
[0009]在上述方案中,所述将所述每个分组进行细分组处理,根据每个组内的细分组处理结果确定风险团伙,包括:将每个用户对应的第一序列向量进行离散化处理,得到第三序列向量;对所述第三序列向量进行降维处理,得到第四序列向量;将所述每个分组中所有用户对应的第四序列向量进行聚类处理,得到所述每个分组内的用户聚类结果;在所述用户聚类结果中,若第一类别的用户数量超过预设的数量阈值,则将所述第一类别中的用户构成的集合确定为所述风险团伙。
[0010]在上述方案中,所述将每个用户对应的第一序列向量进行离散化处理,得到第三序列向量,包括:根据所述第一序列向量中所有维度的数值,确定预设数量的编号以及每个编号对应的预设范围;针对所述第一序列向量中的每个维度的数值,将所述数值所在的预设范围对应的编号确定为第三序列向量中对应维度的数值;其中,所述第一序列向量与所述第三序列向量在每个维度的数值一一对应。
[0011]在上述方案中,所述对所述第三序列向量进行降维处理,得到第四序列向量,包括:将所述第三序列向量按照第二时间划分为第二数量的第二子向量,所述第二数量为正整数;将每个第二子向量中出现频次最多的数值映射为所述第四序列向量中每个维度对应的数值。
[0012]第二方面,本申请实施例提供一种团伙挖掘装置,所述团伙挖掘装置包括:向量获取模块,用于根据用户在不同时间的交易的行为特征,获取所述用户的第一序列向量;分组模块,用于将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组;团伙确定模块,用于将每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙;其中,所述第一分组处理的分组粒度大于所述第二分组处理的分组粒度。
[0013]第三方面,本申请实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的团伙挖掘方法。
[0014]第四方面,本申请实施例提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行本申请实施例提供的团伙挖掘方法。
[0015]本申请实施例提供的团伙挖掘方法,根据用户在不同时间的交易的行为特征,获取所述用户的第一序列向量;将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组;将所述每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙;其中,所述第一分组处理的分组粒度大于所述第二分组处理的分组粒度。本申请的团伙挖掘方法通过将第一序列向量进行第一分组处理和第二分组处理两次处理,可以降低团伙挖掘方法的时间复杂度,提高团伙挖掘方法的效率和准确率。
附图说明
[0016]附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请实施例提供的团伙挖掘方法的一种可选处理流程示意图;图2是本申请实施例提供的第一分组处理方法的一种可选处理流程示意图;图3是本申请实施例提供的第二分组处理方法中离散化处理的一种可选处理流程示意图;图4是本申请实施例提供的第二分组处理方法中聚类处理的一种可选处理流程示意图;图5是本申请实施例提供的团伙挖掘装置的一种可选结构示意图;图6是本申请实施例提供的一种可选电子设备示意性框图。
具体实施方式
[0017]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0018]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0019]在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种团伙挖掘方法,其特征在于,所述方法包括:根据用户在不同时间的交易的行为特征,获取所述用户的第一序列向量;将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组;将所述每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙;其中,所述第一分组处理的分组粒度大于所述第二分组处理的分组粒度。2.根据权利要求1所述的方法,其特征在于,所述将所述第一序列向量在降维处理后得到的第二序列向量进行第一分组处理,得到每个分组,包括:将所述第一序列向量按照第一时间划分为第一数量的第一子向量,所述第一数量为正整数;基于所述第一子向量对应的行为特征,对所述第一序列向量进行降维处理,得到第二序列向量;对所述第二序列向量进行聚类处理,得到所述每个分组。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一子向量对应的行为特征,对所述第一序列向量进行降维处理,得到第二序列向量,包括:针对每个第一子向量,根据所述第一子向量对应的所述行为特征确定所述第一子向量对应的活跃值;基于所述活跃值确定所述第一子向量在降维后对应的值;基于所述第一子向量在降维后对应的值,确定所述第二序列向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述活跃值确定所述第一子向量在降维后对应的值,包括:若所述活跃值大于或者等于预设的活跃阈值,则将所述第一子向量在降维后对应的值确定为第一数值;若所述活跃值小于所述活跃阈值,则将所述第一子向量在降维后对应的值确定为第二数值;所述第一数值与所述第二数值不相等。5.根据权利要求1所述的方法,其特征在于,所述将所述每个分组进行第二分组处理,根据每个组内的第二分组处理结果确定风险团伙,包括:将每个用户对应的第一序列向量进行离散化处理,得到第三序列向量;对所述第三序列向量进行降维处理,得到第四序列向量;将所述每个分组中所有用户对应的第四序列向量进行聚类处理,得到所述每个分组内的...

【专利技术属性】
技术研发人员:李晨阳岳恒孙悦蔡准
申请(专利权)人:北京芯盾时代科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1