异常用户识别方法及装置、存储介质、电子设备制造方法及图纸

技术编号:25481036 阅读:64 留言:0更新日期:2020-09-01 23:01
本申请是关于一种异常用户识别方法,属于信息处理技术领域,该方法包括:对待异常识别数据集进行降维处理,得到降维后的数据集;对降维后的数据集通过聚类处理形成多个待识别群组;通过计算每个待识别群组与降维后的数据集在各个特征上的分布相异度及每个待识别群组的紧密度,确定多个待识别群组中的风险群组;以待识别群组为节点,待识别群组之间的分布相似度为边权重,构建群组完全连通图;将风险群组作为风险节点,运用社区发现算法检测群组完全连通图中存在的节点社区,以对每个包含风险节点的节点社区进行风险评分,确定风险社区,作为识别出的异常用户群。该方法提高了金融交易中异常用户识别的召回率与精确度。

【技术实现步骤摘要】
异常用户识别方法及装置、存储介质、电子设备
本申请涉及信息处理
,具体而言,涉及一种异常用户识别方法、异常用户识别装置、计算机可读存储介质以及电子设备。
技术介绍
随着AI(人工智能)热潮的兴起与蓬勃发展,AI技术在金融三反(反欺诈、反洗钱与反舞弊)发挥着越来越大的作用。但运用AI技术进行欺诈与洗钱等风险识别却存在标签少或无标签的技术难点,因此无监督学习技术几乎成了唯一的选择。其中,应用较广泛的三类主流无监督学习的算法为:聚类算法、异常值检测算法和复杂网络算法。但是以上三种算法均存在各自的缺陷与不足,例如聚类算法划分得到的群组与异常之间通常没有必然联系;异常值检测算法FPR(FalsePositiveRate,假正率)过高,容易误伤好客户;复杂网络算法中强关系属性缺失或数据质量参差不齐,导致复杂网络在风险识别领域难以发挥较好的作用。因此,现有技术中存在异常用户识别时,风险识别的召回率与精确率较低,风险监测方法应用领域较小的问题。因此,需要提供一种新的异常用户识别方法及装置。需要说明的是,在上述
技术介绍
分公开的信息仅用于加本文档来自技高网...

【技术保护点】
1.一种异常用户识别方法,其特征在于,包括:/n对待异常识别数据集进行降维处理,得到降维后的数据集,所述待异常识别数据集为第一用户集的金融交易相关数据;/n对所述降维后的数据集通过聚类处理形成多个待识别群组,所述待识别群组对应于第二用户集,所述第二用户集包括所述第一用户集中的多个用户;/n通过计算每个所述待识别群组与所述降维后的数据集在各个特征上的分布相异度及每个所述待识别群组的紧密度,确定多个所述待识别群组中的风险群组;/n以所述待识别群组为节点,所述待识别群组之间的分布相似度为边权重,构建群组完全连通图;/n将所述风险群组作为风险节点,运用社区发现算法检测所述群组完全连通图中存在的节点社区...

【技术特征摘要】
1.一种异常用户识别方法,其特征在于,包括:
对待异常识别数据集进行降维处理,得到降维后的数据集,所述待异常识别数据集为第一用户集的金融交易相关数据;
对所述降维后的数据集通过聚类处理形成多个待识别群组,所述待识别群组对应于第二用户集,所述第二用户集包括所述第一用户集中的多个用户;
通过计算每个所述待识别群组与所述降维后的数据集在各个特征上的分布相异度及每个所述待识别群组的紧密度,确定多个所述待识别群组中的风险群组;
以所述待识别群组为节点,所述待识别群组之间的分布相似度为边权重,构建群组完全连通图;
将所述风险群组作为风险节点,运用社区发现算法检测所述群组完全连通图中存在的节点社区,以对每个包含所述风险节点的节点社区进行风险评分,确定风险社区,作为识别出的异常用户群。


2.根据权利要求1所述的异常用户识别方法,其特征在于,所述对所述降维后的数据集通过聚类处理形成多个待识别群组,包括:
以所述降维后的数据集中的用户作为节点,用户之间的相似度为边权重,构建完全连通图;
删除所述完全连通图中权重小于第一层级的边权重阈值的边,得到第一层级的待搜索连通图;
从所述第一层级的待搜索连通图开始,从各层级的待搜索连通图中依次搜索第一层级之后各层级的多个连通子图,直到目标层级的连通子图中节点的个数小于预定个数,其中,各层级的待搜索连通图通过从各层级的连通子图中删除权重小于各层级的边权重阈值的边,且后一层级的边权重阈值高于前一层级的边权重阈值;
将所述目标层级中各连通子图对应的用户集合,作为所述待识别群组。


3.根据权利要求2所述的异常用户识别方法,其特征在于,所述方法还包括:
计算所述目标层级中各连通子图的紧密度,并删除所述紧密度低于预设的紧密度阈值的连通子图,得到剩余的连通子图;
将剩余的各所述连通子图对应的用户集合,作为所述待识别群组。


4.根据权利要求1所述的异常用户识别方法,其特征在于,在所述以所述待识别群组为节点,所述待识别群组之间的分布相似度为边权重,构建群组完全连通图之后,还包括:
计算每个所述待识别群组与所述降维后的数据集在各个特征上的分布相似度之和;
删除每个所述待识别群组中与所述降维后的数据集在各个特征上的分布相似度之和大于预定阈值的特征对应的边权重。


5.根据权利要求1所述的异常用户识别方法,其特征在于,所述将所述风险群组作为风险节点还包括:
以所述风险群组作为初始风险种子,在所述群组完全连通图上执行图传播计算,得到与...

【专利技术属性】
技术研发人员:钟红发何振尹小亮古承炬林育芳陈炯其
申请(专利权)人:平安直通咨询有限公司上海分公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1