信贷风险确定和数据处理方法、设备、介质及程序产品技术

技术编号:30270859 阅读:10 留言:0更新日期:2021-10-09 21:25
本申请实施例提供一种信贷风险确定和数据处理方法、设备、介质及程序产品。在本申请实施例中,可对待测用户的信贷申请数据和样本用户的信贷申请数据分别进行特征提取,确定待测用户的信贷特征和样本用户的信贷特征;并根据待测用户的信贷特征及样本用户的信贷特征,计算待测用户与样本用户之间的相似度;可根据待测用户与样本用户之间的相似度及样本用户的风险属性,确定待测用户的风险属性。由于在对待测用户进行信贷风险预测时,引入了待测用户与样本用户之间的相似度,可根据待测用户与样本用户之间的相似度,解释待测用户被确定为当前风险属性的原因,使得信贷风险预测结果具有可解释性,有助于满足信贷风控场景对可解释性的要求。的要求。的要求。

【技术实现步骤摘要】
信贷风险确定和数据处理方法、设备、介质及程序产品


[0001]本申请涉及数据处理
,尤其涉及一种信贷风险确定和数据处理方法、设备、介质及程序产品。

技术介绍

[0002]深度学习模型,能够有更强的表征能力,在很多场景下都取得了更好的模型效果。但深度学习模型一方面,对样本的数据量需求比较大,而信贷风控场景下的样本量一般比较难以满足深度网络的数据需求;另一方面,深度学习模型的可解释性欠佳,无法满足信贷风控场景对于可解释性的要求。

技术实现思路

[0003]本申请的多个方面提供一种信贷风险确定和数据处理方法、设备、存储介质及程序产品,用以满足信贷风控场景对可解释性的要求。
[0004]本申请实施例提供一种信贷风险确定方法,包括:获取待测用户的信贷申请数据以及风险属性已知的第一样本用户的信贷申请数据;对所述待测用户的信贷申请数据和所述第一样本用户的信贷申请数据分别进行特征提取,以确定所述待测用户的信贷特征和所述第一样本用户的信贷特征;根据所述待测用户的信贷特征及所述第一样本用户的信贷特征,计算所述待测用户与所述第一样本用户之间的相似度;根据所述待测用户与所述第一样本用户之间的相似度以及所述第一样本用户的风险属性,确定所述待测用户的风险属性。
[0005]本申请实施例还提供一种数据处理方法,包括:获取待测对象的生产数据以及质量属性已知的样本对象的生产数据;对所述待测对象的生产数据和所述样本对象的生产数据分别进行特征提取,以确定所述待测对象的生产特征和所述样本对象的生产特征;根据所述待测对象的生产特征和所述样本对象的生产特征,计算所述待测对象与所述样本对象之间的相似度;根据所述待测对象与所述样本对象之间的相似度以及所述样本对象的质量属性,确定所述待测对象的质量属性。
[0006]本申请实施例还提供一种计算机设备,包括:存储器和处理器;其中,所述存储器,用于存储计算机程序;所述处理器耦合至所述存储器,用于执行所述计算机程序以用于执行上述信贷风险确定方法和/或数据处理方法中的步骤。
[0007]本申请实施例还提供一种存储有计算机指令的计算机可读存储介质,当所述计算机指令被一个或多个处理器执行时,致使所述一个或多个处理器执行上述信贷风险确定方
法和/或数据处理方法中的步骤。
[0008]本申请实施例还提供一种计算机程序产品,包括:计算机程序;当所述计算机程序被处理器执行,致使所述处理器执行上述信贷风险确定方法和/或数据处理方法中的步骤。
[0009]在本申请实施例中,可对待测用户的信贷申请数据和样本用户的信贷申请数据分别进行特征提取,确定待测用户的信贷特征和样本用户的信贷特征;并根据待测用户的信贷特征及样本用户的信贷特征,计算待测用户与样本用户之间的相似度;之后,可根据待测用户与样本用户之间的相似度及样本用户的风险属性,确定待测用户的风险属性。本申请实施例提供的信贷风险确定方式在对待测用户进行信贷风险预测时,引入了待测用户与样本用户之间的相似度,可以根据待测用户与样本用户之间的相似度,解释待测用户被确定为当前风险属性的原因,使得信贷风险预测具有可解释性,有助于满足信贷风控场景对可解释性的要求。
附图说明
[0010]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1为本申请实施例提供的信贷风险确定方法的流程示意图;图2为本申请实施例提供的另一信贷风险确定方法的流程示意图;图3为本申请实施例提供的模型训练过程示意图;图4为本申请实施例提供的样本获取方式的过程示意图;图5为本申请实施例提供的数据处理方法的流程示意图;图6为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
[0011]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0012]在信贷风控场景下,目前主流的风险预测模型是评分卡模型。但是,评分卡模型属于线性模型,无法获取特征之间的非线性关系,导致信贷风险预测的准确度较低。而深度学习模型虽然能够获取复杂的特征关系,但是可解释性较差。如何在兼顾信贷风险预测的准确度的同时,满足信贷风控场景可解释性的要求,成为本领域技术人员亟待解决的技术问题。
[0013]为了满足信贷风控场景可解释性的要求,在本申请一些实施例中,可对待测用户的信贷申请数据和样本用户的信贷申请数据分别进行特征提取,确定待测用户的信贷特征和样本用户的信贷特征;并根据待测用户的信贷特征及样本用户的信贷特征,计算待测用户与样本用户之间的相似度;之后,可根据待测用户与样本用户之间的相似度及样本用户的风险属性,确定待测用户的风险属性。本申请实施例提供的信贷风险确定方式在对待测用户进行信贷风险预测时,引入了待测用户与样本用户之间的相似度,可以根据待测用户与样本用户之间的相似度,解释待测用户被确定为当前风险属性的原因,使得信贷风险预
测具有可解释性,有助于满足信贷风控场景对可解释性的要求。
[0014]以下结合附图,详细说明本申请各实施例提供的技术方案。
[0015]应注意到:相同的标号在下面的附图以及实施例中表示同一物体,因此,一旦某一物体在一个附图或实施例中被定义,则在随后的附图和实施例中不需要对其进行进一步讨论。
[0016]图1为本申请实施例提供的信贷风险确定方法的流程示意图。如图1所示,该方法包括:101、获取待测用户的信贷申请数据以及风险属性已知的样本用户的信贷申请数据。
[0017]102、对待测用户的信贷申请数据和样本用户的信贷申请数据分别进行特征提取,以确定待测用户的信贷特征和样本用户的信贷特征。
[0018]103、根据待测用户的信贷特征及样本用户的信贷特征,计算待测用户与样本用户之间的相似度。
[0019]104、根据待测用户与样本用户之间的相似度以及样本用户的风险属性,确定待测用户的风险属性。
[0020]在本实施例中,信贷是指以偿还和付息为条件的价值运动形式,通常包括银行存款、贷款等信用活动,也可包括其它形式的贷款活动,如信用卡消费、白条消费或者其它先消费后付款的行为。信贷风险预测主要是指对用户是否具有逾期风险进行预测和预测。相应地,风险属性可包括:有逾期风险和无逾期风险等。
[0021]待测用户可为任意信贷申请的用户,可为申请信贷的用户,也可为申请信贷成功的用户。用户可以为单位用户、集体用户或个人用户等。信贷申请数据是指与信贷风险预测相关的任何数据,可包括:用户信息、用户申请的贷款信息及用户历史行为信息等。其中,用户历史行为信息可包括:用户历史消费行为数据、用户历史信贷行为数据等。这些信贷申请数据在一定程度上可反映用户的信贷特征。
...

【技术保护点】

【技术特征摘要】
1.一种信贷风险确定方法,其特征在于,包括:获取待测用户的信贷申请数据以及风险属性已知的第一样本用户的信贷申请数据;对所述待测用户的信贷申请数据和所述第一样本用户的信贷申请数据分别进行特征提取,以确定所述待测用户的信贷特征和所述第一样本用户的信贷特征;根据所述待测用户的信贷特征及所述第一样本用户的信贷特征,计算所述待测用户与所述第一样本用户之间的相似度;根据所述待测用户与所述第一样本用户之间的相似度以及所述第一样本用户的风险属性,确定所述待测用户的风险属性。2.根据权利要求1所述的方法,其特征在于,所述根据所述待测用户与所述第一样本用户之间的相似度以及所述第一样本用户的风险属性,确定所述待测用户的风险属性,包括:对所述待测用户与所述第一样本用户之间的相似度进行归一化处理,得到所述第一样本用户的风险属性的权重;利用所述第一样本用户的风险属性的权重,对所述第一样本用户的风险属性进行加权求和,以得到所述待测用户的风险值;根据所述待测用户的风险值,确定所述待测用户的风险属性。3.根据权利要求2所述的方法,其特征在于,所述根据所述待测用户的风险值,确定所述待测用户的风险属性,包括:若所述待测用户的风险值大于或等于设定的风险阈值,确定所述待测用户的风险属性为有逾期风险。4.根据权利要求1所述的方法,其特征在于,还包括:根据所述待测用户与所述第一样本用户之间的相似度,从所述第一样本用户中选取与所述待测用户之间的相似度满足设定相似度要求的目标样本用户;根据所述目标样本用户的信贷申请数据,分析所述待测用户的风险属性的影响因素。5.根据权利要求1

4任一项所述的方法,其特征在于,所述对所述待测用户的信贷申请数据和所述第一样本用户的信贷申请数据分别进行特征提取,以确定所述待测用户的信贷特征和所述第一样本用户的信贷特征,包括:将所述待测用户的信贷申请数据和所述第一样本用户的信贷申请数据输入孪生网络模型;在所述孪生网络模型中,对所述待测用户的信贷申请数据和所述第一样本用户的信贷申请数据分别进行特征提取,以确定所述待测用户的信贷特征和所述第一样本用户的信贷特征。6.根据权利要求5所述的方法,其特征在于,所述根据所述待测用户的信贷特征及所述第一样本用户的信贷特征,计算所述待测用户与所述第一样本用户之间的相似度,包括:将所述待测用户的信贷特征及所述第一样本用户的信贷特征输入相似度计算模型;在所述相似度计算模型中,计算所述待测用户的信贷特征与所述第一样本用户的信贷特征之间的距离;确定所述待测用户的信贷特征与所述第一样本用户的信贷特征之间的距离,作为所述待测用户与所述第一样本用户之间的相似...

【专利技术属性】
技术研发人员:张阿飞
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1