信用评价模型的生成方法技术

技术编号:39518886 阅读:8 留言:0更新日期:2023-11-25 18:57
本公开关于一种信用评价模型的生成方法

【技术实现步骤摘要】
信用评价模型的生成方法、装置、设备和介质


[0001]本公开涉及人工智能和风控
,尤其涉及信用评价模型的生成方法

装置

设备和介质


技术介绍

[0002]在客户申请金融机构
(
比如银行
)
的业务产品
(
如贷款产品
)
时,可以采用信用评价模型对客户进行筛选和违约风险判断,比如,采用信用评价模型对与客户关联的业务数据进行信用预测,得到的信用得分可用于指示客户的信用状况,比如,当信用得分相对较低时,表明客户的信用较低,即客户可能存在较高的违约风险
(
如还款能力较低等
)。
目前的信用评价模型在开发时使用的样本数据,不是从申请样本总体中随机选择的,而是从过去已经被接受的样本
(
可称为接受样本或通过样本
)
中选择的,即,用于建模的样本范围为业务产品申请通过的接受样本

[0003]然而,如果仅根据接受样本建模,而忽略业务产品申请未通过的拒绝样本,则建立的信用评价模型将存在缺陷

因此,可以考虑将拒绝样本纳入信用评价模型的开发样本集,这种方法被称为拒绝演绎

[0004]相关技术中的拒绝演绎方法,是将所有的拒绝样本定义为坏样本,或者,随机赋予拒绝样本为好样本或坏样本

这种赋予拒绝样本好坏标签的方式,会影响最终构建的信用评价模型的准确性

专利
技术实现思路

[0005]本公开提供一种信用评价模型的生成方法

装置

设备和介质,以至少在一定程度上解决相关技术中的技术问题之一

本公开的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种信用评价模型的生成方法,包括:
[0007]获取第一样本集

第二样本集和参考信用评价模型;其中,所述第一样本集中的各第一样本中包括与第一业务产品关联且审批通过的第一业务数据,所述第二样本集中的各第二样本中包括与第二业务产品关联且审批未通过的第二业务数据;所述参考信用评价模型是根据各所述第一样本和各所述第一样本携带的第一标签生成的,所述第一标签用于指示所述第一样本的质量;
[0008]采用所述参考信用评价模型分别对各所述第一样本和各所述第二样本进行信用预测,以得到各所述第一样本的第一信用得分和各所述第二样本的第二信用得分;
[0009]根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签;其中,所述第二标签用于指示所述第二样本的质量;
[0010]根据所述各所述第一样本和各所述第一样本的第一标签,以及根据各所述第二样本和各所述第二样本的第二标签,生成目标信用评价模型

[0011]根据本公开实施例的第二方面,提供一种信用评价模型的生成装置,包括:
[0012]获取模块,用于获取第一样本集

第二样本集和参考信用评价模型;其中,所述第
一样本集中的各第一样本中包括与第一业务产品关联且审批通过的第一业务数据,所述第二样本集中的各第二样本中包括与第二业务产品关联且审批未通过的第二业务数据;所述参考信用评价模型是根据各所述第一样本和各所述第一样本携带的第一标签生成的,所述第一标签用于指示所述第一样本的质量;
[0013]预测模块,用于采用所述参考信用评价模型分别对各所述第一样本和各所述第二样本进行信用预测,以得到各所述第一样本的第一信用得分和各所述第二样本的第二信用得分;
[0014]确定模块,用于根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签;其中,所述第二标签用于指示所述第二样本的质量;
[0015]生成模块,用于根据所述各所述第一样本和各所述第一样本的第一标签,以及根据各所述第二样本和各所述第二样本的第二标签,生成目标信用评价模型

[0016]根据本公开实施例的第三方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如本公开上述实施例所述的信用评价模型的生成方法

[0017]根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本公开上述实施例所述的信用评价模型的生成方法

[0018]根据本公开实施例的第五方面,提供一种计算机程序产品,包括:计算机程序,所述计算机程序被处理器执行时实现如本公开上述实施例所述的信用评价模型的生成方法

[0019]本公开的实施例提供的技术方案至少带来以下有益效果:
[0020]通过获取第一样本集

第二样本集和参考信用评价模型;其中,参考信用评价模型是根据第一样本集中的各第一样本和各第一样本携带的第一标签生成的;采用参考信用评价模型分别对各第一样本和第二样本集中的各第二样本进行信用预测,以得到各第一样本的第一信用得分和各第二样本的第二信用得分;根据各第一样本的第一信用得分和各第二样本的第二信用得分,确定各第二样本的第二标签;根据各第一样本和各第一样本的第一标签,以及根据各第二样本和各第二样本的第二标签,生成目标信用评价模型

由此,根据各个第一样本
(
即接受样本或通过样本
)
,构建参考信用评价模型,并基于参考信用评价模型预测的信用得分,来确定各个第二样本
(
即拒绝样本或未通过样本
)
的标签,而非随机赋予第二样本对应的标签,可以提升最终生成或构建的目标信用评价模型的准确性和稳定性

[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开

附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定

[0023]图1是本公开第一实施例所示出的信用评价模型的生成方法的流程示意图

[0024]图2是本公开第二实施例所示出的信用评价模型的生成方法的流程示意图

[0025]图3是本公开第三实施例所示出的信用评价模型的生成方法的流程示意图

[0026]图4是本公开第四实施例所示出的信用评价模型的生成方法的流程示意图

[0027]图5是本公开第五实施例所示出的信用评价模型的生成方法的流程示意图

[0028]图6是本公开第六实施例所示出的信用评价模型的生成方法的流程示意图

[0029]图7是本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种信用评价模型的生成方法,其特征在于,所述方法包括:获取第一样本集

第二样本集和参考信用评价模型;其中,所述第一样本集中的各第一样本中包括与第一业务产品关联且审批通过的第一业务数据,所述第二样本集中的各第二样本中包括与第二业务产品关联且审批未通过的第二业务数据;所述参考信用评价模型是根据各所述第一样本和各所述第一样本携带的第一标签生成的,所述第一标签用于指示所述第一样本的质量;采用所述参考信用评价模型分别对各所述第一样本和各所述第二样本进行信用预测,以得到各所述第一样本的第一信用得分和各所述第二样本的第二信用得分;根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签;其中,所述第二标签用于指示所述第二样本的质量;根据所述各所述第一样本和各所述第一样本的第一标签,以及根据各所述第二样本和各所述第二样本的第二标签,生成目标信用评价模型
。2.
根据权利要求1所述的方法,其特征在于,所述根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签,包括:根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,对各所述第一样本和各所述第二样本进行分箱,以得到多个目标分箱;针对任一目标分箱,根据所述任一目标分箱中的各第一样本和对应的第一信用得分,以及根据所述任一目标分箱中的各所述第二样本和对应的第二信用得分,生成所述任一目标分箱的信用评价子模型;基于各所述目标分箱的信用评价子模型,确定所述第二样本集中各第二样本的第二标签
。3.
根据权利要求2所述的方法,其特征在于,所述根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,对各所述第一样本和各所述第二样本进行分箱,以得到多个目标分箱,包括:根据各所述第一样本的第一信用得分,对各所述第一样本进行排序,得到第一排序序列;根据设定数量,对所述第一排序序列进行等频分箱,以得到所述设定数量的初始分箱;根据各所述第二样本的第二信用得分,将各所述第二样本划分至所述设定数量的初始分箱中,以得到所述设定数量的目标分箱
。4.
根据权利要求3所述的方法,其特征在于,所述根据各所述第二样本的第二信用得分,将各所述第二样本划分至所述设定数量的初始分箱中,以得到所述设定数量的目标分箱,包括:针对任一初始分箱,根据所述任一初始分箱中的各第一样本的第一信用得分,确定所述任一初始分箱的得分区间;针对所述第二样本集中的任一第二样本,将所述任一第二样本的第二信用得分与各所述初始分箱的得分区间进行对比,以从各所述初始分箱中确定所述任一第二样本所属的初始分箱;将所述任一第二样本划分至对应所属的初始分箱,以得到目标分箱
。5.
根据权利要求2所述的方法,其特征在于,所述针对任一目标分箱,根据所述任一目
标分箱中的各第一样本和对应的第一信用得分,以及根据所述任一目标分箱中的各所述第二样本和对应的第二信用得分,生成所述任一目标分箱的信用评价子模型,包括:针对任一目标分箱,获取第一样本子集和第二样本子集;其中,所述第一样本子集中包括所述任一目标分箱中的各第一样本,所述第二样本子集中包括所述任一目标分箱中的各第二样本;针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,确定所述任一第二样本对应的参考标签;获取所述第一样本子集中各第一样本对应的多个特征维度的第一特征值,并获取所述第二样本子集中的各第二样本对应的多个特征维度的第二特征值;根据所述第一样本子集中的各第一样本对应的所述多个特征维度的第一特征值和第一标签,以及所述第二样本子集中的各第二样本对应的所述多个特征维度的第二特征值和参考标签,生成所述任一目标分箱的信用评价子模型
。6.
根据权利要求5所述的方法,其特征在于,所述针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,确定所述任一第二样本对应的参考标签,包括:针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,从所述第一样本子集中确定目标样本;从各所述目标样本中确定第一标签为第一设定标签的第一目标样本,及第一标签为第二设定标签的第二目标样本;其中,所述第一目标样本的质量高于所述第二目标样本;在所述第一目标样本的第一数量大于所述第二目标样本的第二数量的情况下,设置所述任一第二样本的参考标签为第一设定标签;在所述第一数量小于或等于所述第二数量的情况下,设置所述任一第二样本的参考标签为第二设定标签
。7.
根据权利要求6所述的方法,其特征在于,所述针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,从所述第一样本子集中确定目标样本,包括:针对所述第二...

【专利技术属性】
技术研发人员:伏峰江涛蔡素贤
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1