异常用户识别的方法及装置、存储介质、电子设备制造方法及图纸

技术编号:25481032 阅读:25 留言:0更新日期:2020-09-01 23:01
本申请涉及数据分析技术领域,提供了一种异常用户识别的方法,通过对待检测用户群组数据构建加权完全连通图,在连通图中找出风险节点并查找与风险节点关联的节点,将与所述风险节点关联的节点与所述风险节点共同作为可疑节点,基于社区发现算法确定可疑节点所在的社区,从而对可疑节点所在的社区进行风险评分,最终从待检测用户群组中确定出异常用户群组。本申请的实施例利用人工智能技术进行异常用户识别时,有效提升风险识别的召回率与精确率,以及风险监测方法应用领域范围。

【技术实现步骤摘要】
异常用户识别的方法及装置、存储介质、电子设备
本申请涉及数据分析
,具体而言,涉及一种异常用户识别方法、异常用户识别装置、计算机可读存储介质以及电子设备。
技术介绍
随着人工智能(AI)热潮的兴起与蓬勃发展,人工智能技术在金融三反领域(反欺诈、反洗钱与反舞弊,以下简称异常或风险)发挥着越来越大的作用。但运用AI技术进行欺诈与洗钱等风险检测却存在着标签少或无标签的技术难点,因此无监督学习技术几乎成了唯一选项,其中,应用较广泛的三类主流无监督学习的算法为:聚类算法、异常值检测算法和复杂网络算法。但是以上三种算法在人工智能(AI)风险检测时均存在各自的缺陷与不足,例如聚类算法划分得到的群组与异常之间通常没有必然联系;异常值检测算法FPR(FalsePositiveRate,假正率)过高,容易误伤好客户;复杂网络算法中强关系属性缺失或数据质量参差不齐,导致复杂网络在风险识别领域难以发挥较好的作用。因此,现有技术中存在异常用户识别时,风险识别的召回率与精确率较低,风险监测方法应用领域较小的问题。
技术实现思路
本申请的目的在于提供一种异常用户识别的方法、装置、存储介质以及电子设备,在一定程度上有效提升异常用户识别时,风险识别的召回率与精确率,以及风险监测方法应用领域范围。根据本申请的一个方面,提供了一种异常用户识别方法,包括:获取多个待检测用户群组的行为特征数据,所述待检测用户群组中用户的行为特征相似;分别计算所有所述待检测用户群组之间在各个行为特征上的分布相似度之和作为边权重,以所有所述待检测用户群组为节点,构建用户群组加权完全连通图;通过计算所述用户群组加权完全连通图中各个节点对应的待检测用户群组的行为特征的分布相异度及紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点;根据预设的目标异常场景下的异常特征映射表,获取所述风险节点对应的待检测用户群组中用户的行为特征在所述目标异常场景下的异常场景特征,以根据所述异常场景特征获取所述风险节点中的可疑节点;基于社区发现算法确定所述用户群组加权完全连通图中包含所述可疑节点的可疑节点社区,以对每个包含所述风险节点的可疑节点社区进行风险评分;基于所述风险评分确定异常的可疑节点社区,以将异常的所述可疑节点社区对应的待检测用户群组作为识别出的异常用户群。根据本申请的另一个方面,提供了一种异常用户识别装置,包括:获取待检测用户群组模块,用于获取多个待检测用户群组的行为特征数据,所述待检测用户群组中用户的行为特征相似;构建加权完全连通图模块,用于分别计算所有所述待检测用户群组之间在各个行为特征上的分布相似度之和作为边权重,以所有所述待检测用户群组为节点,构建用户群组加权完全连通图;确定风险用户群组模块,用于通过计算所述用户群组加权完全连通图中各个节点对应的待检测用户群组的行为特征的分布相异度及紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点;获取可疑群组模块,用于根据预设的目标异常场景下的异常特征映射表,获取所述风险节点对应的待检测用户群组中用户的行为特征在所述目标异常场景下的异常场景特征,以根据所述异常场景特征获取所述风险节点中的可疑节点;风险评分模块,用于基于社区发现算法确定所述用户群组加权完全连通图中包含所述可疑节点的可疑节点社区,以对每个包含所述风险节点的可疑节点社区进行风险评分;异常用户群模块,用于基于所述风险评分确定异常的可疑节点社区,以将异常的所述可疑节点社区对应的待检测用户群组作为识别出的异常用户群。根据本申请的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述异常用户识别方法。根据本申请的另一个方面,提供了一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述异常用户识别方法。本申请的提供一种异常用户识别的方法及相关装置,一方面,以用户的行为特征相似的待检测用户群组作为检测对象,而非个体,克服了传统异常值检测算法FPR过高的缺陷,同时结合图社区发现算法,进一步提高了异常用户识别的召回率与精确度;另一方面,基于目标场景下的异常特征映射表映射异常场景特征结合分布相异度及紧密度计算,保证异常用户的范围点(可疑节点)确定的准确性;另一方面,构建用户群组加权完全连通图是基于大量非关系或弱关系特征,无需与传统网络一样依赖于高质量的强关系特征,降低了人工智能技术在进行风险检测时对数据的要求,扩大了人工智能(AI)风险检测方法的可应用范围,提高了异常用户识别的准确性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示意性示出一种异常用户检测的应用场景的系统架构示例图。图2示意性示出一种异常用户识别方法的流程图。图3示意性示出一种构建待检测用户群组的加权完全连通图的流程图。图4示意性示出一种确定风险节点的方法流程图。图5示意性示出一种确定可疑节点社区的方法流程图。图6示意性示出一种对可疑节点社区进行风险评分的方法流程图。图7示意性示出一种异常用户识别装置的流程图。图8示意性示出一种用于实现上述异常用户识别方法的电子设备示例框图。图9示意性示出一种用于实现上述异常用户识别方法的计算机可读存储介质示例框图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本申请的各方面变得模糊。附图中的流程图和框图,图示了按照本专利技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及本文档来自技高网...

【技术保护点】
1.一种异常用户识别方法,其特征在于,包括:/n获取多个待检测用户群组的行为特征数据,所述待检测用户群组中用户的行为特征相似;/n分别计算所有所述待检测用户群组之间在各个行为特征上的分布相似度之和作为边权重,以所有所述待检测用户群组为节点,构建用户群组加权完全连通图;/n通过计算所述用户群组加权完全连通图中各个节点对应的待检测用户群组的行为特征的分布相异度和紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点;/n根据预设的目标异常场景下的异常特征映射表,获取所述风险节点对应的待检测用户群组中用户的行为特征在所述目标异常场景下的异常场景特征,以根据所述异常场景特征获取所述风险节点中的可疑节点;/n基于社区发现算法确定所述用户群组加权完全连通图中包含所述可疑节点的可疑节点社区,以对每个包含所述风险节点的可疑节点社区进行风险评分;/n基于所述风险评分确定异常的可疑节点社区,以将异常的所述可疑节点社区对应的待检测用户群组作为识别出的所述目标异常场景下的异常用户群。/n

【技术特征摘要】
1.一种异常用户识别方法,其特征在于,包括:
获取多个待检测用户群组的行为特征数据,所述待检测用户群组中用户的行为特征相似;
分别计算所有所述待检测用户群组之间在各个行为特征上的分布相似度之和作为边权重,以所有所述待检测用户群组为节点,构建用户群组加权完全连通图;
通过计算所述用户群组加权完全连通图中各个节点对应的待检测用户群组的行为特征的分布相异度和紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点;
根据预设的目标异常场景下的异常特征映射表,获取所述风险节点对应的待检测用户群组中用户的行为特征在所述目标异常场景下的异常场景特征,以根据所述异常场景特征获取所述风险节点中的可疑节点;
基于社区发现算法确定所述用户群组加权完全连通图中包含所述可疑节点的可疑节点社区,以对每个包含所述风险节点的可疑节点社区进行风险评分;
基于所述风险评分确定异常的可疑节点社区,以将异常的所述可疑节点社区对应的待检测用户群组作为识别出的所述目标异常场景下的异常用户群。


2.根据权利要求1所述的方法,其特征在于,所述构建用户群组加权完全连通图还包括:
计算每个所述待检测用户群组与所有待检测用户群组在各个行为特征上的第二分布相似度之和;
删除每个所述待检测用户群组中与所有所述待检测用户群组的第二分布相似度之和大于预定阈值的行为特征所对应的边权重。


3.根据权利要求1所述的方法,其特征在于,所述通过所述用户群组加权完全连通图中各个节点对应的用户群组的行为特征的分布相异度及紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点包括:
计算所述用户群组加权完全连通图中各个节点对应的用户群组的行为特征的分布相异度及紧密度;
根据公式Score=f(ΣDis,A)计算每一所述待检测用户群组的风险得分,其中,所述ΣDis为每个所述待检测群组的各个行为特征的分布相异度之和,所述A为每个所述待识别群组的紧密度;
将风险得分大于预设得分阈值的待检测用户群组所对应的节点作为风险节点,将所述风险节点上传至区块链中。


4.根据权利要求1所述的方法,其特征在于,所述通过计算所述用户群组加权完全连通图中各个节点对应的待检测用户群组的行为特征的分布相异度和紧密度,确定所述用户群组加权完全连通图上风险用户群组所对应的风险节点之后,还包括:
以所述风险节点作为初始风险种子,在所述用户群组加权完全连通图上执行图传播计算,确定与所述初始风险种子在行为特征上的分布相似度超过预定相似度阈值的第二风险节点。


5.根据权利要求1所述的方法,其特征在于,所述基于社区发现算法确定所述用户群组加权完全连通图中包含所述可疑...

【专利技术属性】
技术研发人员:钟红发何振尹小亮古承炬林育芳陈炯其
申请(专利权)人:平安直通咨询有限公司上海分公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1