一种业务策略生成方法、装置及计算机可读存储介质制造方法及图纸

技术编号:30702163 阅读:20 留言:0更新日期:2021-11-06 09:40
本申请提供的业务策略生成方法、装置及计算机可读存储介质,首先对获取的多维度特征变量组成的特征变量集中的特征变量进行筛选;接着,对筛选后的特征变量进行变量衍生,得到衍生特征变量集;再接着,基于筛选出的衍生特征变量及其对应的信息量图,确定规则集;最后,从规则集中提取出符合提取条件的规则作为业务策略。先从多维度特征变量组成的特征变量集中筛选出有效的特征变量,再进行衍生得到新的衍生特征变量,可以避免大量无效的特征变量组合,且能在一定程度上提高运行效率,另外,相对于现有技术中单一变量规则的业务策略,基于多维度特征变量形成的衍生特征变量所构成的业务策略具有更强的泛化性,实际使用时业务策略的有效性更强。的有效性更强。的有效性更强。

【技术实现步骤摘要】
一种业务策略生成方法、装置及计算机可读存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种业务策略生成方法、装置及计算机可读存储介质。

技术介绍

[0002]在进行业务策略制定时,由于特征变量的维度往往较大,一般会简单地按照特征变量的信息量大小做策略,如此导致特征变量的策略相对比较单一,且容易存在与实际业务不相符的情况。此外,这种策略生成的方法都是单一变量规则的组合,没有考虑到特征变量之间的相关性影响,业务策略的泛化能力弱,当线上调用的时候由于线上用户特征和规则生成时有一定差别,单一变量规则仅仅只考虑了一个维度的信息,造成线上实际使用时效果下降,业务策略的有效性较弱。

技术实现思路

[0003]为了至少克服现有技术中的上述不足,本申请的目的在于提供一种业务策略生成方法、装置及计算机可读存储介质,用于解决上述技术问题。
[0004]第一方面,本申请实施例提供一种业务策略生成方法,应用于计算机设备,所述方法包括:
[0005]获取不同维度特征变量组成的特征变量集;
[0006]基于所述特征变量集中各个特征的信息量对所述特征变量集中的特征变量进行筛选;
[0007]对筛选后的特征变量集中的特征变量进行变量衍生,得到衍生特征变量集;
[0008]基于所述衍生特征变量集中各个衍生特征变量的信息量对所述衍生特征变量集中的衍生特征变量进行筛选;
[0009]根据筛选出的衍生特征变量及其对应的信息量图,确定规则集;
[0010]基于预设的提取条件,从所述规则集中提取出满足所述提取条件的规则作为业务策略。
[0011]本申请提供的方案,首先对获取的多维度特征变量组成的特征变量集中的特征变量进行筛选;接着,对筛选后的特征变量进行变量衍生,得到衍生特征变量集;再接着,对衍生特征变量集中的衍射特征变量进行筛选,并基于筛选出的衍生特征变量及其对应的信息量图,确定规则集;最后,从规则集中提取出符合提取条件的规则作为业务策略。先从多维度特征变量组成的特征变量集中筛选出有效的特征变量,再进行衍生得到新的衍生特征变量,可以避免大量无效的特征变量组合,且能在一定程度上提高运行效率,另外,相对于现有技术中单一变量规则的业务策略,基于多维度特征变量形成的衍生特征变量所构成的业务策略具有更强的泛化性,实际使用时业务策略的有效性更强。
[0012]在一种可能的实现方式中,所述获取不同维度特征变量组成的特征变量集的步骤,包括:
[0013]根据观察期和表现期确定的用户标签,将预设时间段中进入所述表现期的用户数据作为样本,回溯出不同维度特征变量组成的特征变量集;
[0014]其中,所述观察期是指业务开展前进行特征变量生成的阶段,所述表现期是指定义用户标签好坏的阶段,在所述表现期中根据用户是否触发预设事件定义用户数据是否为坏样本;所述特征变量集包括业务属性特征、设备属性特征及交易属性特征。
[0015]在一种可能的实现方式中,在业务为信贷风控业务时,在所述基于所述特征变量集中各个特征的信息量对所述特征变量集中的特征变量进行筛选的步骤中,对所述特征变量集中的特征变量进行筛选规则包括:
[0016]筛选出信息量大于预设信息量,且缺失率低于预设缺失率的特征变量;
[0017]筛选出具有单调性的特征变量;
[0018]筛选出分箱后坏账率大于平均坏账率的预设倍数的特征变量;
[0019]剔除趋势与实际不一致的特征变量。
[0020]在一种可能的实现方式中,所述对筛选后的特征变量集中的特征变量进行变量衍生,得到衍生特征变量集的步骤,包括:
[0021]对筛选后的特征变量集中的特征变量进行多维组合得到衍生特征变量集,其中,所述多维组合的方式包括逻辑运算及特征值比较。
[0022]在一种可能的实现方式中,所述基于预设的提取条件,从所述规则集中提取出满足所述提取条件的规则作为业务策略的步骤,包括:
[0023]基于预先设定的提取指标,从所述规则集中提取出符合所述提取指标的规则,其中,所述提取指标包括坏账率及通过率。
[0024]第二方面,本申请实施例还提供一种业务策略生成装置,应用于计算机设备,所述装置包括:
[0025]获取模块,用于获取不同维度特征变量组成的特征变量集;
[0026]第一筛选模块,用于基于所述特征变量集中各个特征的信息量对所述特征变量集中的特征变量进行筛选;
[0027]衍生模块,用于对筛选后的特征变量集中的特征变量进行变量衍生,得到衍生特征变量集;
[0028]第二筛选模块,用于基于所述衍生特征变量集中各个衍生特征变量的信息量对所述衍生特征变量集中的衍生特征变量进行筛选;
[0029]确定模块,用于根据筛选出的衍生特征变量及其对应的信息量图,确定规则集;
[0030]提取模块,用于基于预设的提取条件,从所述规则集中提取出满足所述提取条件的规则作为业务策略。
[0031]在一种可能的实现方式中,所述获取模块具体用于:
[0032]根据观察期和表现期确定的用户标签,将预设时间段中进入所述表现期的用户数据作为样本,回溯出不同维度特征变量组成的特征变量集;
[0033]其中,所述观察期是指业务开展前进行特征变量生成的阶段,所述表现期是指定义用户标签好坏的阶段,在所述表现期中根据用户是否触发预设时事件定义用户数据是否为坏样本;所述特征变量集包括业务属性特征、设备属性特征及交易属性特征。
[0034]在一种可能的实现方式中,在业务为信贷风控业务时,所述第一筛选模块对所述
特征变量集中的特征变量进行筛选规则包括:
[0035]筛选出信息量大于预设信息量,且缺失率低于预设缺失率的特征变量;
[0036]筛选出具有单调性的特征变量;
[0037]筛选出分箱后坏账率大于平均坏账率的预设倍数的特征变量;
[0038]剔除趋势与实际不一致的特征变量。
[0039]在一种可能的实现方式中,所述衍生模块具体用于:
[0040]对筛选后的特征变量集中的特征变量进行多维组合得到衍生特征变量集,其中,所述多维组合的方式包括逻辑运算及特征值比较。
[0041]第三方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有指令,当其被执行时,使得计算机执行上述第一方面或者第一方面中任意一个可能的实现方式中的业务策略生成方法。
[0042]基于上述任意一个方面,首先对获取的多维度特征变量组成的特征变量集中的特征变量进行筛选;接着,对筛选后的特征变量进行变量衍生,得到衍生特征变量集;再接着,对衍生特征变量集中的衍射特征变量进行筛选,并基于筛选出的衍生特征变量及其对应的信息量图,确定规则集;最后,从规则集中提取出符合提取条件的规则作为业务策略。先从多维度特征变量组成的特征变量集中筛选出有效的特征变量,再进行衍生得到新的衍生特征变量,可以避免大量无效的特征变量组合,且能在一定程度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种业务策略生成方法,其特征在于,应用于计算机设备,所述方法包括:获取不同维度特征变量组成的特征变量集;基于所述特征变量集中各个特征的信息量对所述特征变量集中的特征变量进行筛选;对筛选后的特征变量集中的特征变量进行变量衍生,得到衍生特征变量集;基于所述衍生特征变量集中各个衍生特征变量的信息量对所述衍生特征变量集中的衍生特征变量进行筛选;根据筛选出的衍生特征变量及其对应的信息量图,确定规则集;基于预设的提取条件,从所述规则集中提取出满足所述提取条件的规则作为业务策略。2.如权利要求1所述的业务策略生成方法,其特征在于,所述获取不同维度特征变量组成的特征变量集的步骤,包括:根据观察期和表现期确定的用户标签,将预设时间段中进入所述表现期的用户数据作为样本,回溯出不同维度特征变量组成的特征变量集;其中,所述观察期是指业务开展前进行特征变量生成的阶段,所述表现期是指定义用户标签好坏的阶段,在所述表现期中根据用户是否触发预设事件定义用户数据是否为坏样本;所述特征变量集包括业务属性特征、设备属性特征及交易属性特征。3.如权利要求2所述的业务策略生成方法,其特征在于,在业务为信贷风控业务时,在所述基于所述特征变量集中各个特征的信息量对所述特征变量集中的特征变量进行筛选的步骤中,对所述特征变量集中的特征变量进行筛选规则包括:筛选出信息量大于预设信息量,且缺失率低于预设缺失率的特征变量;筛选出具有单调性的特征变量;筛选出分箱后坏账率大于平均坏账率的预设倍数的特征变量;剔除趋势与实际不一致的特征变量。4.如权利要求3所述的业务策略生成方法,其特征在于,所述对筛选后的特征变量集中的特征变量进行变量衍生,得到衍生特征变量集的步骤,包括:对筛选后的特征变量集中的特征变量进行多维组合得到衍生特征变量集,其中,所述多维组合的方式包括逻辑运算及特征值比较。5.如权利要求4所述的业务策略生成方法,其特征在于,所述基于预设的提取条件,从所述规则集中提取出满足所述提取条件的规则作为业务策略的步骤,包括:基于预先设定的提取指标,从所述规则集中提取出符合所述提...

【专利技术属性】
技术研发人员:顾凌云谢旻旗周轩欧舒敏
申请(专利权)人:上海冰鉴信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1