一种基于多视角不完整数据的信贷违约预测方法及系统技术方案

技术编号:20161700 阅读:23 留言:0更新日期:2019-01-19 00:14
本发明专利技术公开了一种基于多视角不完整数据的信贷违约预测方法,包括:S1、对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于完整的输入矩阵构建多视角融合的第一目标函数,并最小化第一目标函数,获得最优的属性视角隶属度矩阵;S3、构建预测过程中的第二目标函数,并最小化第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于最优的属性视角隶属度矩阵和视角权重向量,对用户信贷违约概率进行预测。相应的,本发明专利技术还公开了一种基于多视角不完整数据的信贷违约预测系统。采用本发明专利技术实施例,能够更好地融合缺失视角的不完整数据,提高预测准确率。

【技术实现步骤摘要】
一种基于多视角不完整数据的信贷违约预测方法及系统
本专利技术涉及信息
,尤其涉及一种基于多视角不完整数据的信贷违约预测方法及系统。
技术介绍
随着互联网的发展,互联网技术的发展对金融领域造成的冲击将越来越大,金融的轻应用、碎片化属性将越专利技术显,从传统借贷到P2P平台、再从小额借贷平台,无不体现了一个趋势,占中国企业总数97%以上的小微企业的借贷需求正在逐步被发现,而且越来越受到重视。小微企业固定资产规模小、资产结构中可抵押物比例小、抗风险能力弱、业务不稳定等特点,使其很难申请到抵押贷款和信用贷款。为开发这个新兴市场,人们提出根据客户行为轨迹预测其未来的还贷能力,降低信贷客户违约的风险。例如,可以通过第三方渠道获取用户的历史贷款信息、是否进入银行黑名单、是否有信息不匹配、是否电信欠费、是否属于法院被执行人、以及每家快递公司所体现的该客户接收快递次数等数据,这相当于从不同每个视角探看用户行为,从而能更精准地判断用户的履约可能。然而,这些第三方渠道的数据收集源,都只能得到少量信息,因此数据集会有大量的缺失值。因此,这就衍生出一个挑战,即基于缺失视角的数据预测。这是一个多视角的数据融合问题,传统的方法多视角融合一般用于图像处理技术,要求先有小部分完整数据作为训练,然后根据训练出的模型,对缺失视角的数据进行处理,得出补全后的数据。但是,在基于客户行为轨迹的小额信贷审批场景下,通常通过各种渠道收集了很多视角的信息。然而,收集到的用户行为轨迹多是不完整的,即使单个视角数据,也无法找到一份完整的数据样本。因此,首要的任务是对缺失数据进行填补。传统的缺失数据补全方法,或是基于整个属性的统计值(如均值)为所在属性的缺失数据赋值,或是基于相似样本在该属性上的统计值进行赋值。只是,前者过于简略,会降低后续步骤的预测准确性,而后者则不可行,因为样本集中缺失数据过多,甚至无法找到一对可计算相似度的样本。因此,传统的信贷违约预测准确率低下。
技术实现思路
本专利技术实施例提出一种基于多视角不完整数据的信贷违约预测方法及系统,能够更好地融合缺失视角的不完整数据,提高预测准确率。本专利技术实施例提供一种基于多视角不完整数据的信贷违约预测方法,包括:S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。进一步地,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息;所述输入矩阵为X,其中NS是样本数量,DS是属性数。进一步地,所述S1具体包括:收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;构建与所述输入矩阵X形状相同的空值指示符矩阵I;根据空值指示符矩阵I对输入矩阵X中缺失的属性数据进行填充,获得完整的输入矩阵X。进一步地,所述空值指示符矩阵所述完整的输入矩阵进一步地,所述S2具体包括:构建对角矩阵D,设置属性视角隶属度矩阵A和样本视角隶属度矩阵U;其中,K为视角数;基于所述完整的输入矩阵X、所述对角矩阵D、控制参数α、所述属性视角隶属度矩阵A和样本视角隶属度矩阵U构建多视角融合的第一目标函数L;优化所述属性视角隶属度矩阵A和样本视角隶属度矩阵U,以最小化所述第一目标函数,获得最优的属性视角隶属度矩阵A*;其中,所述第一目标函数的最小化公式为:进一步地,所述样本视角隶属度矩阵U的优化公式为:H(U)=2(ADTDAT)其中,U值是基于上一次的U值迭代计算得出的,H(U)是L对U求偏导后关于U的海森矩阵,λ为学习率。进一步地,所述属性视角隶属度矩阵A中每个值的优化公式为:H(Ai,j)=2Di,j2(UTU)i,j;其中,Aij为A在第i行第j列上的值,H(Aij)是L对A求偏导后关于Aij的海森矩阵,θ为学习率。进一步地,所述S3具体包括:对所述信贷信息样本的还贷情况进行标记,将出现逾期未还贷这一情况的信贷信息样本标记为1,否则标记为0,以构建标签数据Y,设置视角权重向量V,基于所述完整的输入矩阵X、所述对角矩阵D、所述最优的属性视角隶属度矩阵A*、所述标签数据Y、学习率ρ和所述视角权重向量V构建预测过程中的第二目标函数M;优化所述视角权重向量V,以最小化所述第二目标函数M,获得最优的视角权重向量;其中,所述第二目标函数M的最小化公式为:进一步地,所述视角权重向量V的优化公式为:H(V)=2PTP;其中,V值是基于上一次的V值迭代计算得到的,H(V)是M对V求偏导后关于V的海森矩阵,Onek是长度为K的全1向量。相应的,本专利技术实施例提供一种基于多视角不完整数据的信贷违约预测系统,能够上述基于多视角不完整数据的信贷违约预测方法的所有流程,所述系统包括:填充模块,用于收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;第一优化模块,用于基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;第二优化模块,用于基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;以及,预测模块,用于输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。实施本专利技术实施例,具有如下有益效果:先对收集的信贷信息样本中缺失的属性数据进行简单填充,获得完整的输入矩阵,然后对完整的输入矩阵进行多视角融合,抵消掉填充信息对模型精确度的影响,同时,优化属性视角隶属度矩阵和视角权重向量,以支持对视角缺失数据的预测,提高用户信贷违约预测的准确性。附图说明图1是本专利技术提供的基于多视角不完整数据的信贷违约预测方法的一个实施例的流程示意图;图2是本专利技术提供的基于多视角不完整数据的信贷违约预测方法中信贷信息样本的示意图;图3是本专利技术提供的基于多视角不完整数据的信贷违约预测系统的一个实施例的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术提供的基于多视角不完整数据的信贷违约预测方法的一个实施例的流程示意图,包括:S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;S本文档来自技高网
...

【技术保护点】
1.一种基于多视角不完整数据的信贷违约预测方法,其特征在于,包括:S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。

【技术特征摘要】
1.一种基于多视角不完整数据的信贷违约预测方法,其特征在于,包括:S1、收集信贷信息样本,并对收集的信贷信息样本中缺失的属性数据进行填充,获得完整的输入矩阵;S2、基于所述完整的输入矩阵构建多视角融合的第一目标函数,并最小化所述第一目标函数,获得最优的属性视角隶属度矩阵;S3、基于所述完整的输入矩阵和所述最优的属性视角隶属度矩阵构建预测过程中的第二目标函数,并最小化所述第二目标函数,获得最优的视角权重向量;S4、输入待预测的用户信贷信息,并基于所述最优的属性视角隶属度矩阵和所述最优的视角权重向量,对用户信贷违约概率进行预测。2.如权利要求1所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述信贷信息样本包括信贷用户填写的个人信息以及贷款审核方从第三方渠道取得的用户信用信息和用户行为轨迹信息;所述输入矩阵为X,其中NS是样本数量,DS是属性数。3.如权利要求2所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述S1具体包括:收集信贷信息样本,并根据所述信贷信息样本构建输入矩阵X;构建与所述输入矩阵X形状相同的空值指示符矩阵I;根据空值指示符矩阵I对输入矩阵X中缺失的属性数据进行填充,获得完整的输入矩阵X。4.如权利要求3所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述空值指示符矩阵所述完整的输入矩阵5.如权利要求2所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述S2具体包括:构建对角矩阵D,设置属性视角隶属度矩阵A和样本视角隶属度矩阵U;其中,K为视角数;基于所述完整的输入矩阵X、所述对角矩阵D、控制参数α、所述属性视角隶属度矩阵A和样本视角隶属度矩阵U构建多视角融合的第一目标函数L;优化所述属性视角隶属度矩阵A和样本视角隶属度矩阵U,以最小化所述第一目标函数,获得最优的属性视角隶属度矩阵A*;其中,所述第一目标函数的最小化公式为:6.如权利要求5所述的基于多视角不完整数据的信贷违约预测方法,其特征在于,所述样本视角隶属度矩阵U的优化公式为:H(U)=2(ADTDAT);其中,U...

【专利技术属性】
技术研发人员:王琰童华苏辉东
申请(专利权)人:厦门市七星通联科技有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1