一种可视化的准入规则的生成方法、装置、机器可读介质及设备制造方法及图纸

技术编号:28873148 阅读:17 留言:0更新日期:2021-06-15 23:06
本发明专利技术公开了一种可视化的准入规则的生成方法,包括:在线获取业务对象的原始属性数据;对所述原始属性数据进行特征提取,得到多个特征变量;对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;基于所述目标特征变量组成的样本集,生成决策树;将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。本发明专利技术针对目前存在的问题,设计了一套使用决策树算法生成规则的方式,将决策树算法生成的决策树中的节点理解为一个个群,到达该客群的路径中节点的条件组成了划分该客群的规则。

【技术实现步骤摘要】
一种可视化的准入规则的生成方法、装置、机器可读介质及设备
本专利技术涉及人工智能领域,具体涉及一种可视化的准入规则的生成方法、装置、机器可读介质及设备。
技术介绍
信贷业务中,借款客户在进行评分卡打分之前,需要先经过准入规则排除掉一些不合规的客户。通常是信贷业务人员根据经验,再配合excel制定规则。需要手动尝试选择变量和阈值,效率低。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种可视化的准入规则的生成方法、装置、机器可读介质及设备,用于解决现有技术存在的问题。为实现上述目的及其他相关目的,本专利技术提供一种可视化的准入规则的生成方法,包括:在线获取业务对象的原始属性数据;对所述原始属性数据进行特征提取,得到多个特征变量;对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;基于所述目标特征变量组成的样本集,生成决策树;将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。可选地,该方法还包括:在线展示每个所述准入规则对应的客群的人数和客群中的与目标规则对应的用户的比例,其中所述目标规则为所有准入规则中的一个。可选地,该方法还包括:设定筛选规则,并根据所述筛选规则对多个准入规则进行筛选;导出符合筛选规则的准入规则。可选地,该方法还包括:根据所述业务类型,在线确定所述决策树的最大深度限制。为实现上述目的及其他相关目的,本专利技术提供一种可视化的准入规则的生成装置,包括:数据获取模块,用于在线获取业务对象的原始属性数据;特征提取模块,用于对所述原始属性数据进行特征提取,得到多个特征变量;特征筛选模块,用于对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;决策树生成模块,用于基于所述目标特征变量组成的样本集,生成决策树;准入规则生成模块,用于将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。可选地,该装置还包括:显示模块,用于在线展示每个所述准入规则对应的客群的人数和客群中的与目标规则对应的用户的比例,其中所述目标规则为所有准入规则中的一个。可选地,该装置还包括:规则筛选模块,用于设定筛选规则,并根据所述筛选规则对多个准入规则进行筛选;规则导出模块,用于导出符合筛选规则的准入规则。可选地,所述决策树生成模块根据所述业务类型,在线确定所述决策树的最大深度限制。为实现上述目的及其他相关目的,本专利技术还提供一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当所述一个或多个处理器执行时,使得所述设备执行前述的一个或多个所述的方法。为实现上述目的及其他相关目的,本专利技术还提供一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得设备执行前述的一个或多个所述的方法。如上所述,本专利技术提供的一种可视化的准入规则的生成方法、装置、机器可读介质及设备,具有以下有益效果:本专利技术的一种可视化的准入规则的生成方法,包括:在线获取业务对象的原始属性数据;对所述原始属性数据进行特征提取,得到多个特征变量;对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;基于所述目标特征变量组成的样本集,生成决策树;将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。本专利技术针对目前存在的问题,设计了一套使用决策树算法生成规则的方式,将决策树算法生成的决策树中的节点理解为一个个群,到达该客群的路径中节点的条件组成了划分该客群的规则。附图说明图1为本专利技术一实施例一种可视化的准入规则的生成方法的流程图;图2为本专利技术一实施例生成决策树的流程图;图3为本专利技术一实施例一棵决策树的结构示意图;图4为本专利技术一实施例一种可视化的准入规则的生成装置的硬件结构示意图;图5为本专利技术一实施例中终端设备的硬件结构示意图;图6为本专利技术一实施例中终端设备的硬件结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。如图1所示,本申请实施例提供一种可视化的准入规则的生成方法,包括:S11在线获取业务对象的原始属性数据;S12对所述原始属性数据进行特征提取,得到多个特征变量;S13对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;S14基于所述目标特征变量组成的样本集,生成决策树;S15将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。本专利技术将决策树算法生成的决策树中的节点理解为一个个客群,到达该客群的路径中节点的条件组成了划分该客群的规则。在步骤S11中,业务对象的原始属性数据包括业务对象的姓名、年龄、所在地区、职业、收入、文化程度、资产情况、是否发生借贷、是否逾期等。表1在对所述原始属性数据进行特征提取时,会得到多个特征变量。一方面,在这些特征变量中,有的特征携带的信息丰富,有的特征携带的信息有重叠,有的特征则属于无关特征,如果所有特征不经筛选地全部作为训练特征,经常会出现维度灾难问题,甚至会降低模型的准确性;另一方面,不同的业务类型需要不同的特征变量。因此,需要对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;通过特征筛选可以排除无效/冗余的特征,把有用的特征挑选出来作为模型的训练集。例如,对建立申请评分卡模型来说,有用的特征变量包括收入、文化程度、资产情况、是否发生借贷、曾经是否逾期;无用的特征变量为性别、姓名等,则将有用的特征变量作为目标特征变量。其中,所述的目标特征变量包括了模型训练的目的。例如:从某个数据集中选择“bad”作为预测目的,即评分卡模型训练的目的是为了预测申请信贷的客户中是“坏人”的概率。可以将“bad”的值设置为1,在该列特征中,“1”表示历史上申请信贷后发生逾期的“坏人”在一实施例中,如图2所示,所述基于所述目标特征变量组成的样本集,生成决策树包括:S21将所述样本集中的第一个特征变量确定为目标分裂特征,并对所述目标分裂特征执行分裂操作;S22从所述样本集中删除所述目标分裂特征,得到新的样本集;本文档来自技高网...

【技术保护点】
1.一种可视化的准入规则的生成方法,其特征在于,包括:/n在线获取业务对象的原始属性数据;/n对所述原始属性数据进行特征提取,得到多个特征变量;/n对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;/n基于所述目标特征变量组成的样本集,生成决策树;/n将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。/n

【技术特征摘要】
1.一种可视化的准入规则的生成方法,其特征在于,包括:
在线获取业务对象的原始属性数据;
对所述原始属性数据进行特征提取,得到多个特征变量;
对所述多个特征变量进行特征筛选,得到与业务类型相对应的目标特征变量;
基于所述目标特征变量组成的样本集,生成决策树;
将决策树从根节点到每一个叶子节点的每一条路径作为一个准入规则。


2.根据权利要求1所述的可视化的准入规则的生成方法,其特征在于,该方法还包括:
在线展示每个所述准入规则对应的客群的人数和客群中的与目标规则对应的用户的比例,其中所述目标规则为所有准入规则中的一个。


3.根据权利要求1所述的可视化的准入规则的生成方法,其特征在于,该方法还包括:
设定筛选规则,并根据所述筛选规则对多个准入规则进行筛选;
导出符合筛选规则的准入规则。


4.根据权利要求1所述的可视化的准入规则的生成方法,其特征在于,该方法还包括:根据所述业务类型,在线确定所述决策树的最大深度限制。


5.一种可视化的准入规则的生成装置,其特征在于,包括:
数据获取模块,用于在线获取业务对象的原始属性数据;
特征提取模块,用于对所述原始属性数据进行特征提取,得到多个特征变量;
特征筛选模块,用于对所述多个特征变量进行特征筛选,得到与业...

【专利技术属性】
技术研发人员:胡佩涛
申请(专利权)人:北京云从科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1