【技术实现步骤摘要】
一种风险群组的检测方法、装置及设备
[0001]本文件涉及计算机
,尤其涉及一种风险群组的检测方法、装置及设备。
技术介绍
[0002]在金融领域等的风险防控场景中,通常会利用群组聚类算法得到一些可疑或存在风险的群组,为了判断上述群组中的账户是否存在非法交易,需要一种较通用的检测方式对聚类后的群组进行群组的异常定性,上述方式应该能够具有普遍的通用性,然而,常用的处理方式是利用风险标签传播得到群组中黑种子浓度的方式进行群组的异常定性,但是,上述方式会依赖于黑种子标签,对于进行无监督的聚类场景并不适用,而且,上述基于风险标签传播的方式得到的结果,在很大程度上取决于构图方式或风险标签传播方式的设计,而通常,不同的设计者设计的构图方式或风险标签传播方式得到的定性结果可能不一致,从而不仅在上述设计的过程中增加了人工成本,增加了人力资源的消耗,而且,最终得到的定性结果的稳定性较差。为此,需要提供一种更加简单高效、无需黑种子标签即可进行群组的异常定性的技术方案。
技术实现思路
[0003]本说明书实施例的目的是提供一 ...
【技术保护点】
【技术特征摘要】
1.一种风险群组的检测方法,所述方法包括:接收风险群组的检测请求,基于所述检测请求获取待处理的多个不同用户的目标数据,并对所述多个不同用户的目标数据进行聚类处理,得到一个或多个由所述目标数据构成的用户群组,所述目标数据中包括一种或多种不同的数据特征;基于所述多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个所述用户群组和每个所述用户群组中包含的目标数据,分别确定每个所述用户群组中包含的用户数量和每种数据特征的数量;基于每种数据特征对应的出现概率,以及每个所述用户群组中包含的用户数量和每个数据特征的数量,确定每个所述用户群组中包含的每种数据特征分布的出现概率;基于每个所述用户群组中包含的每种数据特征分布的出现概率,确定一个或多个所述用户群组中存在预设风险的用户群组,输出确定出的存在预设风险的用户群组的相关信息。2.根据权利要求1所述的方法,所述方法还包括:对所述多个不同用户的目标数据进行编码处理,得到每个用户的每种数据特征对应的编码信息;所述基于所述多个不同用户的目标数据,确定每种数据特征对应的出现概率,包括:基于每个用户的每种数据特征对应的编码信息,确定所述多个不同用户的目标数据中每种数据特征对应的出现概率。3.根据权利要求2所述的方法,所述对所述多个不同用户的目标数据进行编码处理,得到每个用户的每种数据特征对应的编码信息,包括:通过二值化的二项式特征编码方式分别对所述多个不同用户的目标数据中的每个用户的每种数据特征进行编码处理,得到每个用户的每种数据特征对应的二值化的编码信息,所述二值化中的二值互斥。4.根据权利要求3所述的方法,所述二值化中的二值分别为0和1,所述基于每种数据特征对应的出现概率,以及每个所述用户群组中包含的用户数量和每个数据特征的数量,确定每个所述用户群组中包含的每种数据特征分布的出现概率,包括:分别将每种数据特征对应的出现概率,以及每个所述用户群组中包含的用户数量和每个数据特征的数量输入到概率质量函数PMF中,得到每个所述用户群组中包含的每种数据特征分布的出现概率。5.根据权利要求1所述的方法,所述基于每个所述用户群组中包含的每种数据特征分布的出现概率,确定一个或多个所述用户群组中存在预设风险的用户群组,包括:基于每个所述用户群组中包含的每种数据特征分布的出现概率和预设概率阈值,确定每个所述用户群组中出现概率小于所述预设概率阈值的数据特征;对每个所述用户群组中出现概率小于所述预设概率阈值的数据特征进行聚合处理,得到每个所述用户群组存在预设风险的概率;基于每个所述用户群组存在预设风险的概率和预设的风险概率阈值,确定一个或多个所述用户群组中存在预设风险的用户群组。6.根据权利要求1所述的方法,所述基于每个所述用户群组中包含的每种数据特征分布的出现概率,确定一个或多个所述用户群组中存在预设风险的用户群组,包括:
根据每个所述用户群组中包含的每种数据特征分布的出现概率,对每个所述用户群组中包含的数据特征的出现概率由小到大进行排序,得到每个所述用户群组中排序后的数据特征;从每个所述用户群组中排序后的数据特征中选取排列在前的N种数据特征,其中,N为大于或等于1的整数;对从每个所述用户群组中排序后的数据特征中选取的排列在前的N种数据特征进行聚合处理,得到每个所述用户群组存在预设风险的概率;基于每个所述用户群组存在预设风险的概率和预设的风险概率阈值,确定一个或多个所述用户群组中存在预设风险的用户群组。7.根据权利要求1所述的方法,所述预设风险为欺诈风险或非法金融活动。8.一种风险群组的检测方法,所述方法包括:获取待处理的多个不同用户的目标数据,并对所述多个不同用户的目标数据进行聚类处理,得到一个或多个由所述目标数据构成的用户群组,所述目标数据中包括一种或多种不同的数据特征;基于所述多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个所述用户群组和每个所述用户群组中包含的目标数据,分别确定每个所述用户群组中包含的用户数量和每种数据特征的数量;基于每种数据特征对应的出现概率,以及每个所述用户群组中包含的用户数量和每个数据特征的数量,确定每个所述用户群组中包含的每种数据特征分布的出现概率;基于每个所述用户群组中包含的每种数据特征分布的出现概率,确定一个或多个所述用户群组中存在预设风险的用户群组。9.一种风险群组的检测装置,所述装置包括:数据获取模块,接收风险群组的检测请求,基于所述检测请求获取待处理的多个不同用户的目标数据,并对所述多个不同用户的目标数据进行聚类处理,得到一个或多个由所述目标数据构成的用户群组,所述目标数据中包括一种或多种不同的数据特征;数据处理模块,基于所述多个不同用户的目标数据,确定每种数据特征对应的出现概率,并基于每个所述用户群组和每个所述用户群组中包含的目标数据,分别确定每个所述用户群组中包含的用户数量和每种数据特征的数量;概率确定模块,基于每种数据特征对应的出现概率,以及每个所述用户...
【专利技术属性】
技术研发人员:赵闻飙,赵文龙,张天翼,马博群,董迹海,徐恪,李琦,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。