【技术实现步骤摘要】
信用评价模型的生成方法、装置、设备和介质
[0001]本公开涉及人工智能和风控
,尤其涉及信用评价模型的生成方法
、
装置
、
设备和介质
。
技术介绍
[0002]在客户申请金融机构
(
比如银行
)
的业务产品
(
如贷款产品
)
时,可以采用信用评价模型对客户进行筛选和违约风险判断,比如,采用信用评价模型对与客户关联的业务数据进行信用预测,得到的信用得分可用于指示客户的信用状况,比如,当信用得分相对较低时,表明客户的信用较低,即客户可能存在较高的违约风险
(
如还款能力较低等
)。
目前的信用评价模型在开发时使用的样本数据,不是从申请样本总体中随机选择的,而是从过去已经被接受的样本
(
可称为接受样本或通过样本
)
中选择的,即,用于建模的样本范围为业务产品申请通过的接受样本
。
[0003]然而,如果仅根据接受样本建模,而忽略业务产品申请未通过的拒绝样本,则建立的信用评价模型将存在缺陷
。
因此,可以考虑将拒绝样本纳入信用评价模型的开发样本集,这种方法被称为拒绝演绎
。
[0004]相关技术中的拒绝演绎方法,是将所有的拒绝样本定义为坏样本,或者,随机赋予拒绝样本为好样本或坏样本
。
这种赋予拒绝样本好坏标签的方式,会影响最终构建的信用评价模型的准确性
。
专利 ...
【技术保护点】
【技术特征摘要】
1.
一种信用评价模型的生成方法,其特征在于,所述方法包括:获取第一样本集
、
第二样本集和参考信用评价模型;其中,所述第一样本集中的各第一样本中包括与第一业务产品关联且审批通过的第一业务数据,所述第二样本集中的各第二样本中包括与第二业务产品关联且审批未通过的第二业务数据;所述参考信用评价模型是根据各所述第一样本和各所述第一样本携带的第一标签生成的,所述第一标签用于指示所述第一样本的质量;采用所述参考信用评价模型分别对各所述第一样本和各所述第二样本进行信用预测,以得到各所述第一样本的第一信用得分和各所述第二样本的第二信用得分;根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签;其中,所述第二标签用于指示所述第二样本的质量;根据所述各所述第一样本和各所述第一样本的第一标签,以及根据各所述第二样本和各所述第二样本的第二标签,生成目标信用评价模型
。2.
根据权利要求1所述的方法,其特征在于,所述根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,确定各所述第二样本的第二标签,包括:根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,对各所述第一样本和各所述第二样本进行分箱,以得到多个目标分箱;针对任一目标分箱,根据所述任一目标分箱中的各第一样本和对应的第一信用得分,以及根据所述任一目标分箱中的各所述第二样本和对应的第二信用得分,生成所述任一目标分箱的信用评价子模型;基于各所述目标分箱的信用评价子模型,确定所述第二样本集中各第二样本的第二标签
。3.
根据权利要求2所述的方法,其特征在于,所述根据各所述第一样本的第一信用得分和各所述第二样本的第二信用得分,对各所述第一样本和各所述第二样本进行分箱,以得到多个目标分箱,包括:根据各所述第一样本的第一信用得分,对各所述第一样本进行排序,得到第一排序序列;根据设定数量,对所述第一排序序列进行等频分箱,以得到所述设定数量的初始分箱;根据各所述第二样本的第二信用得分,将各所述第二样本划分至所述设定数量的初始分箱中,以得到所述设定数量的目标分箱
。4.
根据权利要求3所述的方法,其特征在于,所述根据各所述第二样本的第二信用得分,将各所述第二样本划分至所述设定数量的初始分箱中,以得到所述设定数量的目标分箱,包括:针对任一初始分箱,根据所述任一初始分箱中的各第一样本的第一信用得分,确定所述任一初始分箱的得分区间;针对所述第二样本集中的任一第二样本,将所述任一第二样本的第二信用得分与各所述初始分箱的得分区间进行对比,以从各所述初始分箱中确定所述任一第二样本所属的初始分箱;将所述任一第二样本划分至对应所属的初始分箱,以得到目标分箱
。5.
根据权利要求2所述的方法,其特征在于,所述针对任一目标分箱,根据所述任一目
标分箱中的各第一样本和对应的第一信用得分,以及根据所述任一目标分箱中的各所述第二样本和对应的第二信用得分,生成所述任一目标分箱的信用评价子模型,包括:针对任一目标分箱,获取第一样本子集和第二样本子集;其中,所述第一样本子集中包括所述任一目标分箱中的各第一样本,所述第二样本子集中包括所述任一目标分箱中的各第二样本;针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,确定所述任一第二样本对应的参考标签;获取所述第一样本子集中各第一样本对应的多个特征维度的第一特征值,并获取所述第二样本子集中的各第二样本对应的多个特征维度的第二特征值;根据所述第一样本子集中的各第一样本对应的所述多个特征维度的第一特征值和第一标签,以及所述第二样本子集中的各第二样本对应的所述多个特征维度的第二特征值和参考标签,生成所述任一目标分箱的信用评价子模型
。6.
根据权利要求5所述的方法,其特征在于,所述针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,确定所述任一第二样本对应的参考标签,包括:针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,从所述第一样本子集中确定目标样本;从各所述目标样本中确定第一标签为第一设定标签的第一目标样本,及第一标签为第二设定标签的第二目标样本;其中,所述第一目标样本的质量高于所述第二目标样本;在所述第一目标样本的第一数量大于所述第二目标样本的第二数量的情况下,设置所述任一第二样本的参考标签为第一设定标签;在所述第一数量小于或等于所述第二数量的情况下,设置所述任一第二样本的参考标签为第二设定标签
。7.
根据权利要求6所述的方法,其特征在于,所述针对所述第二样本子集中的任一第二样本,根据所述任一第二样本的第二信用得分与所述第一样本子集中各第一样本的第一信用得分之间的差异,从所述第一样本子集中确定目标样本,包括:针对所述第二...
【专利技术属性】
技术研发人员:伏峰,江涛,蔡素贤,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。