一种多特征组合策略的推荐方法技术

技术编号:32027117 阅读:24 留言:0更新日期:2022-01-22 18:58
本发明专利技术属于计算机技术领域,具体涉及一种多特征组合策略的推荐方法,本发明专利技术通过界面化的配置,实现在指定目标变量的情况下,自动推荐多特征组合策略,用以识别和拦截欺诈和信用风险。不仅极大的提升了策略挖掘的效率,也为金融智能风控提供了一种新的自动化方案。基于系统智能化、自动化的进行欺诈信息的挖掘,实现风控规则的快速推荐,并达到实时欺诈策略自适应快速升级的目的。同时本发明专利技术也可以扩展到其他的应用场景,例如:医学诊断、精准营销、保险欺诈以及潜在犯罪预测等。险欺诈以及潜在犯罪预测等。险欺诈以及潜在犯罪预测等。

【技术实现步骤摘要】
一种多特征组合策略的推荐方法


[0001]本专利技术属于计算机
,具体涉及一种多特征组合策略的推荐方法。

技术介绍

[0002]今年来,网络黑色产业链发展形式严峻,黑色产业链的手段及形式层出不穷、波谲云诡;导致互联网金融面临严峻的欺诈挑战。
[0003]目前,线上实时欺诈策略体系如何自适应的快速升级,以抵御变幻莫测的黑色产业链的攻击,是新形式造就的一个重要研究方向,在互联网信贷欺诈风控领域,如何实现基于大数据技术,针对各个欺诈风险场景挖掘显著规则策略,一直是各家金融机构重点研究的课题。
[0004]针对上述技术问题,当前行业内的通用做法一般是模型人员或策略人员通过调优脚本的方式选择最优的组合策略规则。组合策略规则指的是由多个特征变量组成的规则策略。但采用上述方式选择最优的组合策略规则,将会导致相关人员的工作强度大,人工成本高,并且通过人工操作的方式风险也会增加。

技术实现思路

[0005]本专利技术公开了一种多特征组合策略的推荐方法,拟解决
技术介绍
中提到的相关人员工作强度高、人工成本高以及采用人工操作的方式风险也为增加的技术问题。
[0006]为解决上述技术问题,本专利技术采用的技术方案如下:一种多特征组合策略的推荐方法,包括以下步骤:步骤1:任务定义模块根据多特征组合策略的挖掘需要,通过界面化自定义推荐任务;步骤2:样本选择模块根据自定义的推荐任务,选择关联的数据集,指定相互关联的数据集生成样本数据大宽表;步骤3:特征加工模块对样本数据大宽表中的原始特征变量进行可视化配置,实现基于表达式运算的自定义二次加工能力,衍生丰富的特征;步骤4:目标自定义模块对进行可视化配置后的数据集进行目标变量的定义;步骤5:特征选择模块通过可视化界面选择每个目标变量的特征推荐方法;步骤6:多特征组合策略推荐模块通过可视化界面定义每个目标变量的策略推荐方法和阈值,并基于步骤5选择的每个目标变量的特征推荐方法,生成推荐的多特征组合策略集;步骤7:报告生成模块基于多特征组合策略推荐模块生成的多特征组合策略集生成显著显著组合策略推荐报告。
[0007]本专利技术通过界面化的配置,实现在指定目标变量的情况下,自动推荐多特征组合策略,用以识别和拦截欺诈和信用风险。不仅极大的提升了策略挖掘的效率,也为金融智能风控提供了一种新的自动化方案。基于系统智能化、自动化的进行欺诈信息的挖掘,实现风
控规则的快速推荐,并达到实时欺诈策略自适应快速升级的目的。同时本专利技术也可以扩展到其他的应用场景,例如:医学诊断、精准营销、保险欺诈以及潜在犯罪预测等。
[0008]本专利技术的一种多特征组合策略的推荐方法,特别适合但并不限于运用于互联网欺诈体系的场景中,还可以运用于贷前准入策略挖掘场景,当本专利技术运用于贷款场景中时,所述的推荐任务为用户数据,例如用户的人行信用数据、还款数据、还款能力数据和社保数据等;最后金融机构可以得到贷前准入策略报告。
[0009]优选的,所述步骤6中所述的多特征组合策略推荐模块包括四种推荐方法,所述四种推荐方法分别为:基于WOE计算的推荐方法、等距划分分组方法、分位数划分分组方法和决策树划分分支方法;所述阈值的评价指标为Lift和坏占比指标。
[0010]阈值评价指标Lift是评估一个预测模型是否有效的一个度量,它衡量的是一个模型对目标中“响应”的预测能力优于随机选择的倍数,以1为界线,Lift的值大于1表示该模型或规则比随机选择捕捉了更多的“响应”。本专利技术采用Lift指标来衡量多特征组合策略的效果显著性,某个多特征组合策略的Lift越大则该规则效果越好,具有更强的显著性。一般情况下,Lift的值大于2时,说明规则策略具有较强的显著性。
[0011]所述坏占比(badrate)是一个用于评估策略效果的指标,指的是策略命中样本中“坏”样本的比例。
[0012]本专利技术所述的方法默认采用上述4中多特征组合策略的推荐方法,阈值默认为2;即,若有一个推荐任务时,需要采用上述4中多特征组合策略的推荐方法对该推荐任务进行计算,且每个多特征组合策略的推荐方法的阈值均为2。
[0013]优选的,所述步骤6包括以下步骤:步骤6.1:所述基于WOE计算的推荐方法是对每条多特征组合策略进行分组,通过记录每个分组的临界点作为每个特征变量的阈值,遍历所有特征、阈值和运算符的组合,并对每条多特征组合策略计算坏占比和Lift指标,生成推荐的多特征组合策略集;步骤6.2:所述等距划分分组方法是对每条多特征组合策略进行等距划分分组,记录每个分组的临界点作为规则阈值,基于每条多特征组合策略的坏占比和Lift指标遍历各个特征、阈值以及预算符的组合,生成推荐的多特征组合策略集;步骤6.3:所述分位数划分分组方法通过分位数划分分组,记录每个分组的临界点作为规则阈值,基于坏占比和Lift指标遍历各个特征、阈值以及运算符的组合,生成推荐的多特征组合策略集;步骤6.4:所述决策树划分分支方法通过决策树划分分支,每一条分支为一条多特征组合策略,基于坏占比和Lift指标遍历每个分支,生成推荐的多特征组合策略集。
[0014]优选的,所述步骤6.1包括以下步骤:步骤6.1.1:规则阈值点集生成子模块通过对特征变量进行WOE单调分箱,寻找所有箱中的临界点,生成所有特征变量的规则阈值点集;步骤6.1.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集,并计算每条多特征组合策略的坏占比,生成多特征组合策略的坏占比指标集;步骤6.1.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集生成推荐的多特征组合策略集。
[0015]优选的,所述步骤6.2包括以下步骤:步骤6.2.1:规则阈值点集生成子模块对特征变量进行等频分组;基于等频分组后生成所有规则阈值点集的方法如下:经过等频分组后,最大的组数划分为n组;定义特征变量为;则有n+1个临界点;设特征变量的最大值和最小值分别为和,则对应的分组之间的临界点集分别为,则,其中;基于临界点集生成所有规则阈值点集,其中;步骤6.2.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集,并计算每条多特征组合策略集的坏占比,生成多特征组合策略的坏占比指标集;步骤6.2.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集,自动生成推荐的多特征组合策略集。
[0016]优选的,所述步骤6.3包括以下步骤:步骤6.3.1:规则阈值点集生成子模块对特征变量进行分位数分组,计算每个特征变量中的每个分组之间的临界点集,基于临界点集生成所有特征变量的规则阈值点集;步骤6.3.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集;并计算每条多特征组合策略集的坏占比,生成多特征组合策略的坏占比指标集;步骤6.3.3:多特征组合策略集推荐子模块根据阈值的评价指标Lif本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多特征组合策略的推荐方法,其特征在于,包括以下步骤:步骤1:任务定义模块根据多特征组合策略的挖掘需要,通过界面化自定义推荐任务;步骤2:样本选择模块根据自定义的推荐任务,选择关联的数据集,指定相互关联的数据集生成样本数据大宽表;步骤3:特征加工模块对样本数据大宽表中的原始特征变量进行可视化配置,实现基于表达式运算的自定义二次加工能力,衍生丰富的特征;步骤4:目标自定义模块对可视化配置后的数据集进行目标变量的定义;步骤5:特征选择模块通过可视化界面选择每个目标变量的特征推荐方法;步骤6:多特征组合策略推荐模块通过可视化界面定义每个目标变量的策略推荐方法和阈值,并基于步骤5选择的每个目标变量的特征推荐方法,生成推荐的多特征组合策略集;步骤7:报告生成模块基于多特征组合策略推荐模块生成的多特征组合策略集生成显著显著组合策略推荐报告。2.根据权利要求1所述的一种多特征组合策略的推荐方法,其特征在于,所述步骤6中所述的多特征组合策略推荐模块包括四种推荐方法,所述四种推荐方法分别为:基于WOE计算的推荐方法、等距划分分组方法、分位数划分分组方法和决策树划分分支方法;所述阈值的评价指标为Lift和坏占比指标。3.根据权利要求2所述的一种多特征组合策略的推荐方法,其特征在于,所述步骤6包括以下步骤:步骤6.1:所述基于WOE计算的推荐方法是对每条多特征组合策略进行分组,通过记录每个分组的临界点作为每个特征变量的阈值,遍历所有特征、阈值和运算符的组合,并对每条多特征组合策略计算坏占比和Lift指标,生成推荐的多特征组合策略集;步骤6.2:所述等距划分分组方法是对每条多特征组合策略进行等距划分分组,记录每个分组的临界点作为规则阈值,基于每条多特征组合策略的坏占比和Lift指标遍历各个特征、阈值以及预算符的组合,生成推荐的多特征组合策略集;步骤6.3:所述分位数划分分组方法通过分位数划分分组,记录每个分组的临界点作为规则阈值,基于坏占比和Lift指标遍历各个特征、阈值以及运算符的组合,生成推荐的多特征组合策略集;步骤6.4:所述决策树划分分支方法通过决策树划分分支,每一条分支为一条多特征组合策略,基于坏占比和Lift指标遍历每个分支,生成推荐的多特征组合策略集。4.根据权利要求3所述的一种多特征组合策略的推荐方法,其特征在于, 所述步骤6.1包括以下步骤:步骤6.1.1:规则阈值点集生成子模块通过对特征变量进行WOE单调分箱,寻找所有箱中的临界点,生成所有特征变量的规则阈值点集;步骤6.1.2:多特征组合策略评价指标遍历子模块通过交叉遍历的方式,遍历所有特征变量的规则阈值点集,生成多特征组合策略集,并计算每条多特征组合策略的坏占比,生成多特征组合策略的坏占比指标集;步骤6.1.3:多特征组合策略集推荐子模块根据阈值的评价指标Lift,并基于多特征组合策略的坏占比指标集生成推荐的多特征组合策略集。
5.根据权利要求3所述的一种多特征组合策略的推荐方法,其特征在于, 所述步骤6.2包括以下步骤:步骤6.2.1:规则阈值点集生成子模块对特征变量进行等频分...

【专利技术属性】
技术研发人员:王萍贾坤
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1