一种群体风险特征的可视化方法、装置、设备及存储介质制造方法及图纸

技术编号:26034993 阅读:14 留言:0更新日期:2020-10-23 21:13
本发明专利技术公开了一种群体风险特征的可视化方法、装置、设备及存储介质。该方法包括:获取多组样本数据,基于预先设置的风控模型对至少一个样本参数形成的组合进行预测,基于对各样本参数的组合的预测结果得到所述各个样本数据的组合的初始特征贡献值;基于预设算法分别确定各个样本参数的目标特征贡献值;基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息;将所述群体贡献信息转换为可视化文本或者图形,并进行展示。以对各模型输入数据对预测结果的影响进行可视化。

【技术实现步骤摘要】
一种群体风险特征的可视化方法、装置、设备及存储介质
本专利技术实施例涉及金融风控
,尤其涉及一种群体风险特征的可视化方法、装置、设备及存储介质。
技术介绍
在金融风控领域,我们通常需要做大量的数据分析工作才能获知客户群体的风险特征,现有的技术方案多是通过建立风控模型,对于风控模型的预测结果做出相应的风控策略,而在风控模型训练的过程中通常会根据特征在特定的评价函数中的增益情况来构造切分节点,其训练得到的模型结构天生带有某种特征重要性信息。然而,目前通过风控模型仅能获知风控模型的预测结果,无法了解输入参数对预测结果的影响。
技术实现思路
本专利技术提供一种群体风险特征的可视化方法、装置、设备及存储介质,第一方面,本专利技术实施例提供了一种群体风险特征的可视化方法,包括:获取多组样本数据,基于预先设置的风控模型对至少一个样本参数形成的组合进行预测,基于对各样本参数的组合的预测结果得到所述各个样本数据的组合的初始特征贡献值;基于预设算法分别确定各个样本参数的目标特征贡献值;基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息;将所述群体贡献信息转换为可视化文本或者图形,并进行展示。第二方面,本专利技术实施例还提供了一种感知群体风险特征的装置,该装置包括:数据获取模块,用于获取多组样本数据,基于预先设置的风控模型对所述样本数据进行预测,得到所述样本数据中个样本参数的初始特征贡献值;贡献值确定模块,用于基于预设算法分别确定各个样本参数的目标特征贡献值;信息确定模块,用于基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息;信息展示模块,用于将所述群体贡献信息转换为可视化文本或者图形,并进行展示。第三方面,本专利技术实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本专利技术任意实施例提供的群体风险特征的可视化方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任意实施例提供的群体风险特征的可视化方法。本专利技术通过获取多组样本数据,基于预先设置的风控模型对所述样本数据进行预测,得到所述样本数据中个样本参数的初始特征贡献值,基于预设算法分别确定各个样本参数的目标特征贡献值,基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息,将所述群体贡献信息转换为可视化文本或者图形,并进行展示。以对各模型输入数据对预测结果的影响进行可视化。附图说明图1是本专利技术实施例一提供的群体风险特征的可视化方法的流程图;图2是本专利技术实施例一提供的确定样本参数目标特征贡献值的结构图;图3是本专利技术实施例二提供的群体风险特征的可视化方法的流程图;图4是本专利技术实施例二提供的各个样本参数风险排序的示例图;图5是本专利技术实施例二提供的各个样本参数影响价值的示例图;图6是本专利技术实施例二提供的当前样本参数目标特征贡献值的示例图;图7是本专利技术实施例二提供的各个样本参数间交互作用的示例图;图8是本专利技术实施例三提供的群体风险特征的可视化方法的流程图;图9是本专利技术实施例四提供的群体风险特征的可视化装置的结构示意图;图10是本专利技术实施例五中的设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的群体风险特征的可视化方法的流程图,本实施例可适用于对群体风险特征进行处理的情况,该方法可以由群体风险特征处理的装置来执行,该群体风险特征处理的装置可以采用软件和/或硬件的方式实现。如图1所示,该方法具体包括:S110、获取多组样本数据,基于预先设置的风控模型对至少一个样本参数形成的组合进行预测,基于对各样本参数的组合的预测结果得到所述各个样本数据的组合的初始特征贡献值。在本实施例中,多组样本数据为预先设置的风控模型的输入样本数据;预先设置的风控模型可以是但不限于已经训练好的神经网络模型、逻辑回归模型和Boosting树模型;本实施例对风控模型的具体类型不加以限制。在风控模型中输入样本参数进行预测并获取预测结果,其中,预测结果为样本的欺诈概率,基于各个样本的欺诈概率进行计算获得样本数据中各个样本参数的初始特征贡献值;其中,各个样本参数的初始特征贡献值为样本数据中各个样本参数在对当前的预测结果产生影响的重要性,可选的,样本参数的初始特征贡献值包括单一样本参数的初始特征贡献值和任意样本参数组合的初始特征贡献值。具体的,如图2所示树形图代表某一用户x0的模型预测情况,每个节点代表一个样本特征组合,而每条边代表样本特征的初始特征贡献,即两个连接节点的预测之间的差距可以归因于样本附加特征的影响。假设当用户没有任何样本特征表征时,其欺诈概率为0.5;当加上Age样本特征时,预测到他的欺诈概率为0.4,其余样本特征组合类似。这意味着知道x0的年龄会使预测降低0.01。因此,Age样本特征相对于无任何样本特征的情况下带来的初始贡献值为-0.01。风控模型是通过样本数据训练得到,其中,样本数据的获取可以采用大数据引擎采集得到,以对用户的交易数据进行欺诈预测为例,样本数据可以是用户的交易数据,例如交易数据可以包括但不限于用户首次授信距今小时数、设备风险等级、订单总金额、7天内用户当前下单设备关联账户数、校区交易欺诈风险等级、3天内账户关联APP端设备数、30天内用户当前下单设备关联账户数、用户风险等级、用户交易前1天登陆过的设备数和客户之前没有过人工审核通过的记录等。样本数据的获取过程可以是通过业务流程画像、行为埋点、聚合关联信息、设备行为画像、团伙识别画像、APP画像、短信画像、网爬天眼查、获取网贷账单和接收外部输入数据等方式获取。进一步的,基于获取样本数据对应的已产生的交易行为建立已标记欺诈标签或正常标签,通过上述样本数据和对应的标签对风控模型进行预测,得到具有预测功能的风控模型。S120、基于预设算法分别确定各个样本参数的目标特征贡献值。在本实施例中,样本参数的目标特征贡献值为目标样本参数的在样本中的影响程度。在一些实施例中,预设算法可以是SHAP(SHapleyAdditiveexPlanation,夏普利加法解释算法)算法,目标特征贡献值可以基于SHAP算法计算得到的各样本参数的SHAP值。由于每个样本参数对预测结果的影响不局限于样本参数本身对预测结果的影响,还包括该样本参数与其他样本参数组合对预测结果的影响,本实施例中,通过当前样本参数的初始特征贡献值和包括当前样本本文档来自技高网...

【技术保护点】
1.一种群体风险特征的可视化方法,其特征在于,包括:/n获取多组样本数据,基于预先设置的风控模型对至少一个样本参数形成的组合进行预测,基于对各样本参数的组合的预测结果得到所述各个样本数据的组合的初始特征贡献值;/n基于预设算法分别确定各个样本参数的目标特征贡献值;/n基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息;/n将所述群体贡献信息转换为可视化文本或者图形,并进行展示。/n

【技术特征摘要】
1.一种群体风险特征的可视化方法,其特征在于,包括:
获取多组样本数据,基于预先设置的风控模型对至少一个样本参数形成的组合进行预测,基于对各样本参数的组合的预测结果得到所述各个样本数据的组合的初始特征贡献值;
基于预设算法分别确定各个样本参数的目标特征贡献值;
基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息;
将所述群体贡献信息转换为可视化文本或者图形,并进行展示。


2.根据权利要求1所述的群体风险特征的可视化方法,其特征在于,样本参数的初始特征贡献值包括单一样本参数的初始特征贡献值和任意样本参数组合的初始特征贡献值;
所述基于预设算法分别确定各个样本参数的目标特征贡献值,包括:
对于当前样本参数,分别确定所述当前样本参数和包括所述当前样本参数的样本参数组合的权重;
基于所述权重,对所述当前样本参数的初始特征贡献值和包括所述当前样本参数的样本参数组合的初始特征贡献值进行加权计算,得到所述当前样本参数的目标特征贡献值。


3.根据权利要求2所述的方法,其特征在于,所述分别确定所述当前样本参数和包括所述当前样本参数的样本参数组合的权重,包括:
基于预设规则,以及当前样本参数或者样本参数组合中参数数量确定各所述当前样本参数和包括所述当前样本参数的样本参数组合的权重;
其中,所述预设规则包括权重和为1、相同样本参数数量的样本参数组合的权重相同,各个同一样本参数数量的样本参数组合的权重和相同。


4.根据权利要求1所述的群体风险特征的可视化方法,其特征在于,所述样本参数的群体贡献信息包括:各个样本参数的群体贡献值、各个样本参数的影响价值和任意组合的样本参数之间的交互作用中的至少一项。


5.根据权利要求4所述的群体风险特征的可视化方法,其特征在于,所述基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息,包括:
对于任一样本参数,对各个样本数据中所述样本参数的目标特征贡献值进行绝对值均值处理,得到所述样本参数的群体贡献值。


6.根据权利要求4所述的方法,其特征在于,所述各样本参数的影响价值包括正向影响价值和负向影响价值;
所述基于所述多组样本数据中各个样本参数的目标特征贡献值确定所述样本参数的群体贡献信息,包括:
对于任一样本参数,统计各个样本...

【专利技术属性】
技术研发人员:黎相麟
申请(专利权)人:深圳市卡牛科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1