一种异常用户团体的识别方法、识别装置及可读存储介质制造方法及图纸

技术编号:24579381 阅读:24 留言:0更新日期:2020-06-21 00:51
本申请提供了一种异常用户团体的识别方法、识别装置及可读存储介质,所述识别方法包括:基于的每一个用户业务起始时间以及预设时间间隔,生成多个用户集;将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算用户团体中全部用户之间的第一相似度值;基于每一个业务维度下的第一相似度值以及对应的维度权重系数,确定用户团体的全部用户之间的第二相似度值;按照预设排列次序,将每一个用户团体的全部用户之间的第二相似度值排序,将排序在预设数量之前的多个用户团体,确定为多个异常用户团体。这样,通过异常用户团体确定出多个关联异常用户,有助于提高异常用户判断的效率以及准确率。

An abnormal user group identification method, identification device and readable storage medium

【技术实现步骤摘要】
一种异常用户团体的识别方法、识别装置及可读存储介质
本申请涉及数据分析统计
,尤其是涉及一种异常用户团体的识别方法、识别装置及可读存储介质。
技术介绍
随着互联网金融的迅猛发展,金融领域的相关业务对信息技术有越来越多的利用,用户在互联网上进行金融交易的过程中,可能会存在一些异常操作,进行虚假交易,严重影响了互联网金融系统的安全性。现阶段,对于异常用户的排查,还是基于固定规则针对于单个用户的单笔交易进行判断,判断一个用户的单笔交易的异常情况,需要判断的数据量大,并且单笔数据准确性低,可同时定性分析的用户数量较少,影响异常用户判断的效率以及准确率。
技术实现思路
有鉴于此,本申请的目的在于提供一种异常用户团体的识别方法、识别装置及可读存储介质,通过对划分出的用户团体中用户之间的相似度的分析,确定出至少一个异常用户团体,并基于异常用户团体确定出多个关联异常用户,有助于提高异常用户判断的效率以及准确率。本申请实施例提供了一种异常用户团体的识别方法,所述识别方法包括:基于获取到的每一个用户的业务信息指示的业务起始时间以及预设时间间隔,将多个用户进行划分生成多个用户集;将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算所述用户团体中全部用户之间的第一相似度值;将每一个业务维度下的第一相似度值以及对应的维度权重系数线性加权,确定所述用户团体的全部用户之间的第二相似度值;按照预设排列次序,将确定出的多个用户团体中的每一个用户团体的全部用户之间的第二相似度值排序,并将排序在预设数量之前的多个第二相似度值对应的多个用户团体,确定为多个异常用户团体。进一步的,所述业务维度包括数值型业务维度和类别型业务维度中的一种。进一步的,当所述业务维度包括数值型业务维度时,通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:针对同一业务维度,获取该业务维度下所述用户团体中每一个用户对应的特征值,并加和全部用户对应的特征值,确定特征值和值;将每一个用户对应的特征值分别与所述特征值和值作差,得到多个第一差值,并确定每一个第一差值的第一差值绝对值;加和第一差值绝对值,得到绝对值和值,并将所述绝对值和值与所述特征值和值的第一商值,确定为初始第一数值相似度;将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。进一步的,当所述业务维度包括类别型业务维度时,通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:针对同一业务维度,获取该业务维度下每一个用户对应的业务类型,并统计在该维度下的业务类型总个数以及用户总数;将所述业务类型总个数以及所述用户总数的第二商值,所述用户团体中全部用户之间的初始第一相似度值;将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。进一步的,通过以下步骤确定所述第一相似度值:确定同一业务维度下,每一个用户团体对应的初始第一相似度值,并确定全部初始第一相似度值中最大的初始第一相似度值以及最小的初始第一相似度值;将所述最大的初始第一相似度值分别与每一个初始第一相似度值作差,得到多个第二差值;将所述最大的初始第一相似度值以及所述最小的初始第一相似度值之间的第三差值,确定为归一化系数;将每一个第二差值与所述归一化系数作商,确定多个第一相似度值。本申请实施例还提供了一种异常用户团体的识别装置,所述识别装置包括:用户集生成模块,用于基于获取到的每一个用户的业务信息指示的业务起始时间以及预设时间间隔,将多个用户进行划分生成多个用户集;第一相似度值计算模块,用于将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算所述用户团体中全部用户之间的第一相似度值;第二相似度值确定模块,用于将每一个业务维度下的第一相似度值以及对应的维度权重系数线性加权,确定所述用户团体的全部用户之间的第二相似度值;异常用户团体确定模块,用于按照预设排列次序,将确定出的多个用户团体中的每一个用户团体的全部用户之间的第二相似度值排序,并将排序在预设数量之前的多个第二相似度值对应的多个用户团体,确定为多个异常用户团体。进一步的,所述业务维度包括数值型业务维度和类别型业务维度中的一种。进一步的,当所述业务维度包括数值型业务维度时,所述第一相似度值计算模块用于通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:针对同一业务维度,获取该业务维度下所述用户团体中每一个用户对应的特征值,并加和全部用户对应的特征值,确定特征值和值;将每一个用户对应的特征值分别与所述特征值和值作差,得到多个第一差值,并确定每一个第一差值的第一差值绝对值;加和第一差值绝对值,得到绝对值和值,并将所述绝对值和值与所述特征值和值的第一商值,确定为初始第一数值相似度;将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。进一步的,当所述业务维度包括类别型业务维度时,所述第一相似度值计算模块用于通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:针对同一业务维度,获取该业务维度下每一个用户对应的业务类型,并统计在该维度下的业务类型总个数以及用户总数;将所述业务类型总个数以及所述用户总数的第二商值,所述用户团体中全部用户之间的初始第一相似度值;将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。进一步的,所述第一相似度值计算模块用于通过以下步骤确定所述第一相似度值:确定同一业务维度下,每一个用户团体对应的初始第一相似度值,并确定全部初始第一相似度值中最大的初始第一相似度值以及最小的初始第一相似度值;将所述最大的初始第一相似度值分别与每一个初始第一相似度值作差,得到多个第二差值;将所述最大的初始第一相似度值以及所述最小的初始第一相似度值之间的第三差值,确定为归一化系数;将每一个第二差值与所述归一化系数作商,确定多个第一相似度值。本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的异常用户团体的识别方法的步骤。本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的异常用户团体的识别方法的步骤。本申请实施例提供的异常用户团体的识别方法、识别装置及可读存储装置,基于获取到的每一个用户的业务信息指示的业务起始时间以及预设时间间隔,将多个用户进行划分生成多个用户集;将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算所述用户团体中全部用户之间的第一相似度值;本文档来自技高网...

【技术保护点】
1.一种异常用户团体的识别方法,其特征在于,所述识别方法包括:/n基于获取到的每一个用户的业务信息指示的业务起始时间以及预设时间间隔,将多个用户进行划分生成多个用户集;/n将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算所述用户团体中全部用户之间的第一相似度值;/n将每一个业务维度下的第一相似度值以及对应的维度权重系数线性加权,确定所述用户团体的全部用户之间的第二相似度值;/n按照预设排列次序,将确定出的多个用户团体中的每一个用户团体的全部用户之间的第二相似度值排序,并将排序在预设数量之前的多个第二相似度值对应的多个用户团体,确定为多个异常用户团体。/n

【技术特征摘要】
1.一种异常用户团体的识别方法,其特征在于,所述识别方法包括:
基于获取到的每一个用户的业务信息指示的业务起始时间以及预设时间间隔,将多个用户进行划分生成多个用户集;
将在每一个用户集中重复关联出现的多个用户,确定为一个用户团体,并在每一个业务维度下计算所述用户团体中全部用户之间的第一相似度值;
将每一个业务维度下的第一相似度值以及对应的维度权重系数线性加权,确定所述用户团体的全部用户之间的第二相似度值;
按照预设排列次序,将确定出的多个用户团体中的每一个用户团体的全部用户之间的第二相似度值排序,并将排序在预设数量之前的多个第二相似度值对应的多个用户团体,确定为多个异常用户团体。


2.根据权利要求1所述的识别方法,其特征在于,所述业务维度包括数值型业务维度和类别型业务维度中的一种。


3.根据权利要求2所述的识别方法,其特征在于,当所述业务维度包括数值型业务维度时,通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:
针对同一业务维度,获取该业务维度下所述用户团体中每一个用户对应的特征值,并加和全部用户对应的特征值,确定特征值和值;
将每一个用户对应的特征值分别与所述特征值和值作差,得到多个第一差值,并确定每一个第一差值的第一差值绝对值;
加和第一差值绝对值,得到绝对值和值,并将所述绝对值和值与所述特征值和值的第一商值,确定为初始第一数值相似度;
将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。


4.根据权利要求2所述的识别方法,其特征在于,当所述业务维度包括类别型业务维度时,通过以下步骤计算所述用户团体中全部用户之间的第一相似度值:
针对同一业务维度,获取该业务维度下每一个用户对应的业务类型,并统计在该维度下的业务类型总个数以及用户总数;
将所述业务类型总个数以及所述用户总数的第二商值,所述用户团体中全部用户之间的初始第一相似度值;
将所述初始第一数值相似度归一化,确定所述用户团体中全部用户之间的第一相似度值。


5.根据权利要求3或4所述的识别方法,其特征在于,通过以下步骤确定所述第一相似度值:
确定同一业务维度下,每一个用户团体对应的初始第一相似度值,并确定全部初始第一相似度值中最大的初始第一相似度值以及最小的初始第一相似度值;
将所述最大的初始第一相似度值分别与每一个初始第一相似度值作差,得到多个第二差值;...

【专利技术属性】
技术研发人员:韩跃盛
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1