【技术实现步骤摘要】
异常用户检测方法及装置、存储介质、电子设备
本申请涉及信息处理
,具体而言,涉及一种异常用户检测方法及装置、计算机可读存储介质以及电子设备。
技术介绍
随着AI(人工智能)热潮的兴起与蓬勃发展,AI技术在反欺诈(尤其是团伙欺诈)场景的落地应用越来越受到各行各业的关注。但运用AI技术进行反欺诈检测却存在数据标签少或无标签的技术难点,因此无监督学习技术几乎成了唯一的选择。而无监督学习技术中又以异常检测这类算法在反欺诈中的应用最为普遍和适用。目前已有的异常检测算法框架均以个体为检测对象,因此,这类算法通常又称为异常点(或异常值)检测。然而,异常点检测最为人诟病的是其FPR(FalsePositiveRate,假正率)过高,容易误伤好客户,因为这类算法检测出的仅仅是数据上的异常(outlier),由于各种因素的存在,数据上的异常并不总是意味着真实的欺诈异常。因此,需要提供一种新的异常用户检测方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人 ...
【技术保护点】
1.一种异常用户检测方法,其特征在于,包括:/n采集待异常检测数据集,所述待异常检测数据集为第一用户集的金融交易相关数据;/n对所述待异常检测数据集进行降维处理,得到降维后的数据集;/n对所述降维后的数据集通过聚类处理形成多个待检测群组,所述待检测群组对应于第二用户集,所述第二用户集包括所述第一用户集中的多个用户;/n分别计算所述待检测群组与所述待异常检测数据集重心的偏离程度;/n将与所述待异常检测数据集重心的偏离程度大于预设的偏离程度阈值的待检测群组确定为异常群组,作为检测到的异常用户集。/n
【技术特征摘要】
1.一种异常用户检测方法,其特征在于,包括:
采集待异常检测数据集,所述待异常检测数据集为第一用户集的金融交易相关数据;
对所述待异常检测数据集进行降维处理,得到降维后的数据集;
对所述降维后的数据集通过聚类处理形成多个待检测群组,所述待检测群组对应于第二用户集,所述第二用户集包括所述第一用户集中的多个用户;
分别计算所述待检测群组与所述待异常检测数据集重心的偏离程度;
将与所述待异常检测数据集重心的偏离程度大于预设的偏离程度阈值的待检测群组确定为异常群组,作为检测到的异常用户集。
2.根据权利要求1所述的异常用户检测方法,其特征在于,所述对所述待异常检测数据集进行降维处理,得到降维后的数据集包括:
计算所述待异常检测数据集中每个特征数据的困惑度;
根据所述困惑度筛选符合预定规则的所述特征数据,得到降维后的数据集。
3.根据权利要求2所述的异常用户检测方法,其特征在于,所述根据所述困惑度筛选符合预定规则的所述特征数据,得到降维后的数据集,包括:
获取所述困惑度高于第一预定阈值的特征的数据,作为单维度特征数据集;
获取所述困惑度低于所述第一预定阈值且高于第二预定阈值的特征的数据,并进行组合得到多维度特征数据集,所述第一预定阈值大于所述第二预定阈值;
将所述单维度特征数据集及所述多维度特征数据集作为降维后的数据集。
4.根据权利要求2所述的异常用户检测方法,其特征在于,所述困惑度为所述特征数据的基尼系数或者信息熵。
5.根据权利要求1所述的异常用户检测方法,其特征在于,所述对所述降维后的数据集通过聚类处理形成多个待检测群组,包括:
对所述降维后的数据集通过图层次聚类处理形成多个待检测群组。
6.根据权利要求5所述的异常用户检测方法,其特征在于,所述对所述降维后的数据集通过图层次聚类处理形成多个待检测群组包括:
以所述降维后的数据集中的用户作为节点,用户之间的相似度为边权重,构建完...
【专利技术属性】
技术研发人员:钟红发,何振,尹小亮,古承炬,林育芳,陈炯其,
申请(专利权)人:平安直通咨询有限公司上海分公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。