可输出解释性信息的风控建模方法、装置、设备及介质制造方法及图纸

技术编号:34968123 阅读:23 留言:0更新日期:2022-09-17 12:49
本申请涉及人工智能技术,提供可输出解释性信息的风控建模方法、装置、设备及介质,是先基于业务类型从多个样本特征选定样本特征并筛选而得到对应的已训练决策树模型组成决策树集成模型,然后将待预测用户样本输入至决策树集成模型得到各已训练决策树模型分别输出的预测结果及预测过程遍历节点轨迹,并基于预测过程遍历节点轨迹确定并生成决策树集成模型中所有样本特征分别对应的可解释性结果。实现了基于业务类型对应的初始样本特征集自动确定决策树集成模型,而且在具体应用决策树集成模型进行预测时不仅可以输出预测结果,还可以输出模型对应的可解释性结果,便于用户直观的获取预测结果及其相关的可解释性结果而获取更多模型相关信息。取更多模型相关信息。取更多模型相关信息。

【技术实现步骤摘要】
可输出解释性信息的风控建模方法、装置、设备及介质


[0001]本申请涉及人工智能的机器学习
,尤其涉及一种可输出解释性信息的风控建模方法、装置、设备及介质。

技术介绍

[0002]目前,在很多领域(如科技金融领域)对合法合规取得的用户数据进行用户风险确定时,往往用得较多的方式是基于风控模型获取用户数据对应的风控等级。若基于风控模型对用户数据的风控等级进行分析时,一般只能得到风控模型输出的最终预测结果,并不输出该最终预测结果的可解释性结果,导致了当前的大数据风控模型预测结果的可解释性非常差。

技术实现思路

[0003]本申请实施例提供了一种可输出解释性信息的风控建模方法、装置、计算机设备及存储介质,旨在解决现有技术中基于风控模型对用户数据的风控等级进行分析时只输出最终预测结果,并不输出该最终预测结果的可解释性结果,导致了当前的大数据风控模型预测结果的可解释性非常差的问题。
[0004]第一方面,本申请实施例提供了一种可输出解释性信息的风控建模方法,其包括:根据业务类型从多个样本特征中确定初始样本特征集;重复预设次数从所述初始样本特征集中随机获取样本特征组以得到预设次数个样本特征组所组成的样本特征组集合,其中,所述各样本特征组具有预设第一个数的样本特征;获取与所述样本特征组集合中各样本特征组分别匹配的目标已训练决策树模型,组成决策树集成模型;获取待预测用户样本,将所述待预测用户样本输入至所述决策树集成模型进行样本预测,得到所述决策树集成模型中各已训练决策树模型分别输出的预测结果及预测过程遍历节点轨迹;基于所述决策树集成模型中各已训练决策树模型分别输出的预测过程遍历节点轨迹,确定并生成所述决策树集成模型中所有样本特征分别对应的可解释性结果;输出所述决策树集成模型,所述决策树集成模型中各已训练决策树模型分别输出的预测结果,及所述决策树集成模型中所有样本特征分别对应的可解释性结果。
[0005]第二方面,本申请实施例提供了一种可输出解释性信息的风控建模装置,其包括:初始样本特征集确定单元,用于根据业务类型从多个样本特征中确定初始样本特征集;样本特征组集合获取单元,用于重复预设次数从所述初始样本特征集中随机获取样本特征组以得到预设次数个样本特征组所组成的样本特征组集合,其中,所述各样本特征组具有预设第一个数的样本特征;
决策树集成模型获取单元,用于获取与所述样本特征组集合中各样本特征组分别匹配的目标已训练决策树模型,组成决策树集成模型;预测结果输出单元,用于获取待预测用户样本,将所述待预测用户样本输入至所述决策树集成模型进行样本预测,得到所述决策树集成模型中各已训练决策树模型分别输出的预测结果及预测过程遍历节点轨迹;可解释性结果获取单元,用于基于所述决策树集成模型中各已训练决策树模型分别输出的预测过程遍历节点轨迹,确定并生成所述决策树集成模型中所有样本特征分别对应的可解释性结果;综合输出单元,用于输出所述决策树集成模型,所述决策树集成模型中各已训练决策树模型分别输出的预测结果,及所述决策树集成模型中所有样本特征分别对应的可解释性结果。
[0006]第三方面,本申请实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的可输出解释性信息的风控建模方法。
[0007]第四方面,本申请实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的可输出解释性信息的风控建模方法。
[0008]本申请实施例提供了一种可输出解释性信息的风控建模方法、装置、设备及介质,是先基于业务类型从多个样本特征选定样本特征并筛选而得到对应的已训练决策树模型组成决策树集成模型,然后将待预测用户样本输入至决策树集成模型得到各已训练决策树模型分别输出的预测结果及预测过程遍历节点轨迹,并基于预测过程遍历节点轨迹确定并生成决策树集成模型中所有样本特征分别对应的可解释性结果。实现了基于业务类型对应的初始样本特征集自动确定决策树集成模型,而且在具体应用决策树集成模型进行预测时不仅可以输出预测结果,还可以输出模型对应的可解释性结果,便于用户直观的获取预测结果及其相关的可解释性结果而获取更多模型相关信息。
附图说明
[0009]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1为本申请实施例提供的可输出解释性信息的风控建模方法的应用场景示意图;图2为本申请实施例提供的可输出解释性信息的风控建模方法的流程示意图;图3a为本申请实施例提供的可输出解释性信息的风控建模方法中第1个已训练决策树模型的模型示意图;图3b为本申请实施例提供的可输出解释性信息的风控建模方法中第2个已训练决策树模型的模型示意图;图3c为本申请实施例提供的可输出解释性信息的风控建模方法中第3个已训练决策树模型的模型示意图;
图3d为本申请实施例提供的可输出解释性信息的风控建模方法中第4个已训练决策树模型的模型示意图;图4为本申请实施例提供的可输出解释性信息的风控建模装置的示意性框图;图5为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
[0011]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0012]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和
ꢀ“
包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0013]还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0014]还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0015]请参阅图1和图2,图1为本申请实施例提供的可输出解释性信息的风控建模方法的应用场景示意图;图2为本申请实施例提供的可输出解释性信息的风控建模方法的流程示意图,该可输出解释性信息的风控建模方法应用于服务器中,该方法通过安装于服务器中的应用软件进行执行。
[0016]如图2所示,该方法包括步骤S101~S106。
[0017]S101、根据业务类型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可输出解释性信息的风控建模方法,其特征在于,包括:根据业务类型从多个样本特征中确定初始样本特征集;重复预设次数从所述初始样本特征集中随机获取样本特征组以得到预设次数个样本特征组所组成的样本特征组集合,其中,所述各样本特征组具有预设第一个数的样本特征;获取与所述样本特征组集合中各样本特征组分别匹配的目标已训练决策树模型,组成决策树集成模型;获取待预测用户样本,将所述待预测用户样本输入至所述决策树集成模型进行样本预测,得到所述决策树集成模型中各已训练决策树模型分别输出的预测结果及预测过程遍历节点轨迹;基于所述决策树集成模型中各已训练决策树模型分别输出的预测过程遍历节点轨迹,确定并生成所述决策树集成模型中所有样本特征分别对应的可解释性结果;输出所述决策树集成模型,所述决策树集成模型中各已训练决策树模型分别输出的预测结果,及所述决策树集成模型中所有样本特征分别对应的可解释性结果。2.根据权利要求1所述的可输出解释性信息的风控建模方法,其特征在于,所述根据业务类型从多个样本特征中确定初始样本特征集,包括:若确定所述业务类型为用户金融风险等级确定场景,则从多个样本特征中筛选出与所述用户金融风险等级确定场景对应的样本特征,组成初始样本特征集。3.根据权利要求1所述的可输出解释性信息的风控建模方法,其特征在于,所述重复预设次数从所述初始样本特征集中随机获取样本特征组以得到预设次数个样本特征组所组成的样本特征组集合,包括:获取所述预设次数并记为N1,且获取所述预设第一个数并记为N2;其中,N1和N2均为正整数;从所述初始样本特征集中第i次任意获取N2个样本特征,组成第i组样本特征组;其中,i的初始值为1,且i的取值范围是[1,N1];将i自增1以更新i的取值;若确定i小于或等于N1,则返回执行从所述初始样本特征集中第i次任意获取N2个样本特征,组成第i组样本特征组的步骤;若确定i大于N1,则获取第1组样本特征组至第N1组样本特征组并组成样本特征组集合。4.根据权利要求3所述的可输出解释性信息的风控建模方法,其特征在于,所述重复预设次数从所述初始样本特征集中随机获取样本特征组以得到预设次数个样本特征组所组成的样本特征组集合之后,还包括:将所述样本特征组集合中的相同样本特征组进行合并,以更新所述样本特征组集合。5.根据权利要求3所述的可输出解释性信息的风控建模方法,其特征在于,所述获取与所述样本特征组集合中各样本特征组分别匹配的目标已训练决策树模型,组成决策树集成模型,包括:获取已存储的多个已训练决策树模型,并获取各已训练决策树模型中包括的样本特征;获取所述样本特征组集合中第j组样本特征组;其中,j的初始取值为1,且j的取值范围
是[1,N1];获取所述第j组样本特征组中包括的样本特征;将所述第j组样本特征组中包括的样本特征与各已训练决策树模型中包括的样本特征进行比对;若确定第j组样本特征组中包括的所有样本特征与其中一个已训练决策树模型中包括的所有样本特征相同,则将对应的已训练决策树模型作为所述第j组样本特征组对应的第j目标已训练决策树模型;将j自增1以更新j的取值;若确定j小于或等于N1,则返回执行所述获取所述样本特征组集合中第j组样本特征组的步骤;若确定j大于N1,获取第1目标已训练决策...

【专利技术属性】
技术研发人员:张军涛
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1