【技术实现步骤摘要】
用于执行隐案挖掘的方法和系统
本说明书的一个或多个实施例涉及用于执行隐案挖掘的方法和系统。
技术介绍
随着在线交易系统或支付系统的普及,与之相关联的安全问题也变得普遍,对风险案件的识别和防控也变得日益重要。风险案件包括例如盗号、欺诈、非法套现等。在目前的在线交易系统或支付系统中,已经存在对于这些风险案件进行识别的策略。通过这些策略,很多风险案件被识别出来。另外,通过客户投诉等方式,也可以识别出一些风险案件。然而,仍旧存在一些隐案。隐案可被定义为实际存在风险的、但是被策略漏过且没有被投诉的风险案件或者被策略拦截所以没有表现出来的风险案件,尤其是策略漏过并且没有被投诉的风险案件。在某些安全场景中(比如盗用和欺诈),风险案件通常来自于客户的投诉,但是在某些风险场景中(比如说非法套现),客户通常不会过来投诉,有的话也只是少量,因此黑样本在量上和多元性上会存在不足,相应地,策略和模型的覆盖率也会不足,所以执行隐案挖掘对于风险的主动防控就显得尤为重要。然而,现有技术中缺少能够执行隐案挖掘的方案。即便存在这样的方案,其适用场景、覆盖率、识别效率等通常也仍有改进空间。因此,存在对于适用场景广泛、覆盖率高、识别效率高的隐案挖掘方案的需要。
技术实现思路
为了克服现有技术的缺陷,本说明书的一个或多个实施例提供了适用场景广泛、覆盖率高、识别效率高的隐案挖掘方案。本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。在一个方面中,公开了一种用于执行隐案挖掘的方法,包括:获取样 ...
【技术保护点】
1.一种用于执行隐案挖掘的方法,其特征在于,包括:/n获取样本集,所述样本集包括已知黑样本和未知样本,所述已知黑样本是已经确定为风险案件的样本;/n获取变量池,所述变量池包括多个变量;/n使用所述多个变量的每一种组合,对所述样本集执行聚类算法来得到多个簇;/n计算所述多个簇中的每个簇中的已知黑样本的浓度;/n基于所述多个簇中的每个簇的已知黑样本的浓度,选择一个或多个候选簇;以及/n将所述一个或多个候选簇中的未知样本标识为潜在隐案。/n
【技术特征摘要】
1.一种用于执行隐案挖掘的方法,其特征在于,包括:
获取样本集,所述样本集包括已知黑样本和未知样本,所述已知黑样本是已经确定为风险案件的样本;
获取变量池,所述变量池包括多个变量;
使用所述多个变量的每一种组合,对所述样本集执行聚类算法来得到多个簇;
计算所述多个簇中的每个簇中的已知黑样本的浓度;
基于所述多个簇中的每个簇的已知黑样本的浓度,选择一个或多个候选簇;以及
将所述一个或多个候选簇中的未知样本标识为潜在隐案。
2.如权利要求1所述的方法,其特征在于,选择一个或多个候选簇包括:
确定优选变量组合,所述优选变量组合体现隐案的共同特性;以及
确定使用所述优选变量组合对所述样本集执行聚类算法得到的多个簇,作为多个初步候选簇。
3.如权利要求2所述的方法,其特征在于,确定优选变量组合包括:
将每个簇的已知黑样本浓度与阈值浓度进行比较,从而确定已知黑样本浓度大于所述阈值浓度的一个或多个高黑样本浓度簇;
确定未知样本的数量最多的高黑样本浓度簇;以及
确定与所述未知样本的数量最多的高黑样本浓度簇对应的变量组合。
4.如权利要求2所述的方法,其特征在于,选择一个或多个候选簇还包括:
将所述多个初步候选簇选择为所述候选簇。
5.如权利要求2所述的方法,其特征在于,选择一个或多个候选簇还包括:
将所述多个初步候选簇中的每个初步候选簇的已知黑样本浓度与第二阈值浓度进行比较;以及
将所述多个初步候选簇中已知黑样本浓度大于第二阈值浓度的初步候选簇选择为所述候选簇。
6.如权利要求1所述的方法,其特征在于,选择一个或多个候选簇包括:
将每个簇的已知黑样本浓度与阈值浓度进行比较,从而确定已知黑样本浓度大于所述阈值浓度的一个或多个高黑样本浓度簇;
计算所述一个或多个高黑样本浓度簇中的未知样本的数量;
按照未知样本的数量从多到少对所述一个或多个高黑样本浓度簇排序;以及
选择排序最高的多个高黑样本浓度簇作为所述候选簇。
7.如权利要求1所述的方法,其特征在于,选择一个或多个候选簇包括:
按照已知黑样本浓度从高到低对所述多个簇排序;以及
选择排序最高的多个簇作为候选簇。
8.如权利要求1所述的方法,其特征在于,还包括:
验证所述潜在隐案中的每一个是否为风险案件。
9.如权利要求8所述的方法,其特征在于,验证所述潜在隐案中的每一个是否为风险案件包括:
确定所述潜在隐案与所述已知黑样本是否存在介质关联、IP地址关联或物理地址关联。
10.如权利要求1所述的方法,其特征在于,计算所述多个簇中的...
【专利技术属性】
技术研发人员:陈志招,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。