【技术实现步骤摘要】
一种基于CART算法的多维度策略自动化、批量化挖掘方法
[0001]本专利技术涉及计算机
,具体涉及一种基于CART算法的多维度策略自动化、批量化挖掘方法。
技术介绍
[0002]在金融风控领域,贷前授信申请场景中的风控策略分为单维度策略和多维度策略两种,风控策略是由一条条风控规则组成,策略属于宏观概念,规则属于微观概念;进行多维度策略挖掘的时候,经常使用CART算法分析成千上万个变量,基于分析结果筛选效果好且有业务解释性的多维度规则上线进行风险拦截;然而现有技术中,在进行多维度策略挖掘的时候面临着以下五个难题:1、在使用CART算法对成千上万个变量进行多维度策略挖掘时,构建一棵决策树通常只会使用效果最好的少数几个或几十个变量,还有数以万计的变量未使用,造成了信息的大量浪费;2、在使用CART算法构建完成决策树后,通常是基于决策树结构人为抽取和解析符合要求的多维度规则,效率低;3、无法确定基于训练数据构建决策树并抽取了效果好的多维度规则是否有效;4、无法确定基于CART算法最终筛选的多条效果好的待上线规则同时上线后的效 ...
【技术保护点】
【技术特征摘要】
1.一种基于CART算法的多维度策略自动化、批量化挖掘方法,其特征在于,包括:数据准备步骤,准备分析所需原始变量;多维度策略分析变量池构建步骤,基于缺失率、众数占比、变量间的相关性分析对原始变量进行分析和筛选,确定最终进行多维度策略分析和挖掘的变量池;决策树预构建步骤,在变量池中采用变量组合加均匀分布随机数的方式自动化、批量化抽取组合变量并决定是否生成决策树;决策树构建步骤,基于抽取的组合变量自动化生成决策树;决策树规则抽取和解析步骤,对决策树的规则进行自动抽取,并解析出每条规则包含的叶节点数、叶节点数占建模样本的比例、叶节点对应的坏样本率;规则筛选步骤,按照评估标准根据规则对应的叶节点数、叶节点占建模样本的比例和Lift值筛选效果好的多维度规则;多维度规则泛化步骤,对筛选的效果好的多维度规则跨时间段进行泛化,筛选效果好且在不同时间段上表现稳定的规则,得到分析结果,将分析结果准备上线进行风险管控。2.根据权利要求1所述的一种基于CART算法的多维度策略自动化、批量化挖掘方法,其特征在于:所述原始数据包括因变量、自变量、标签变量和数据字典。3.根据权利要求1所述的一种基于CART算法的多维度策略自动化、批量化挖掘方法,其特征在于,所述决策树预构建步骤,包括:对比值设定步骤,设...
【专利技术属性】
技术研发人员:冯占鹏,
申请(专利权)人:重庆富民银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。