一种逾期预测模型生成方法及终端设备技术

技术编号:19024169 阅读:16 留言:0更新日期:2018-09-26 19:15
本发明专利技术提供了一种逾期预测模型生成方法及终端设备,适用于数据处理技术领域,该方法包括:通过学习模型对用户属性数据进行筛选,得到与逾期类别标签关联度最大的N种用户属性数据;对用户进行随机分组得到多个用户数随机的训练样本矩阵,再分别进行训练得到对应的多个子预测模型;基于包含的用户数计算子预测模型的投票系数,并构建得到所需的逾期预测模型。本发明专利技术实施例实现了对用户逾期的高效准确的预测。

【技术实现步骤摘要】
一种逾期预测模型生成方法及终端设备
本专利技术属于数据处理
,尤其涉及逾期预测模型生成方法及终端设备。
技术介绍
现有技术中对用户贷款后的风险管理较为简单,都是被动式地获取用户是否逾期未还的结果,并在确定出用户逾期后再进行后续的催收或者理赔处理。然而当用户出现逾期未还的情况时,借贷公司已经遭受了一定的经济损失,同时对逾期的用户进行违约资金回收难度较大,使得借贷公司经济损失进一步地加重。综上,现有技术中无法实现对用户的逾期风险进行有效评估预测。
技术实现思路
有鉴于此,本专利技术实施例提供了一种逾期预测模型生成方法及终端设备,以解决现有技术中无法对用户的逾期风险进行有效评估预测的问题。本专利技术实施例的第一方面提供了一种逾期预测模型生成方法,包括:获取M个用户的L种用户属性数据以及逾期类别标签,得到维度为M×(L+1)的输入矩阵,其中,M和L均为正整数;将所述输入矩阵输入到预设的学习模型中,筛选出与所述逾期类别标签关联度最大的N种用户属性数据,所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型,其中,N为小于或等于L的正整数;对所述M个用户进行随机分组,得到用户数Ph随机的H个用户组,并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵,其中,Ph为正整数,H为大于1的正整数,h∈[1,H];将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件,确定出所述H个神经网络模型分别对应的模型参数,得到H个子预测模型;根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数,并基于所述H个子预测模型以及分别对应的所述H个投票系数,构建得到逾期预测模型:Presult=Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中,Presult为所述逾期预测模型的输出结果,Vresulth为第h个所述子预测模型的输出结果,Vcoenth为第h个所述子预测模型对应的所述投票系数。本专利技术实施例的第二方面提供了一种逾期预测模型生成终端设备,所述逾期预测模型生成终端设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤。获取M个用户的L种用户属性数据以及逾期类别标签,得到维度为M×(L+1)的输入矩阵,其中,M和L均为正整数;将所述输入矩阵输入到预设的学习模型中,筛选出与所述逾期类别标签关联度最大的N种用户属性数据,所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型,其中,N为小于或等于L的正整数;对所述M个用户进行随机分组,得到用户数Ph随机的H个用户组,并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵,其中,Ph为正整数,H为大于1的正整数,h∈[1,H];将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件,确定出所述H个神经网络模型分别对应的模型参数,得到H个子预测模型;根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数,并基于所述H个子预测模型以及分别对应的所述H个投票系数,构建得到逾期预测模型:Presult=Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中,Presult为所述逾期预测模型的输出结果,Vresulth为第h个所述子预测模型的输出结果,Vcoenth为第h个所述子预测模型对应的所述投票系数。本专利技术实施例的第三方面提供了一种计算机可读存储介质,包括:存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上所述的逾期预测模型生成方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:通过对用户属性数据的自适应学习,识别出其中与是否曾经逾期的逾期类别标签关联度最大的N种用户属性数据,实现了对最佳用于逾期预测的用户属性的识别,保证了后续对用户是否会逾期预测的高效处理。通过对用户进行随机分组并训练,从而得到随机数量的可用于用户逾期预测的子模型,最后计算每个逾期预测子模型分别对应的投票系数,并将所有逾期预测子模型以及对应的投票系数封装为逾期预测模型,使得逾期预测模型在对用户进行逾期预测时,能够通过各个子模型的预测结果进行投票,并经由对应的投票系数进行最终投票结果的权重计算,从而保证了最终预测结果的准确可靠。因此,本专利技术实施例实现了对用户是否会逾期的高效准确的预测。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的逾期预测模型生成方法的实现流程示意图;图2是本专利技术实施例二提供的逾期预测模型生成方法的实现流程示意图;图3是本专利技术实施例四提供的逾期预测模型生成方法的实现流程示意图;图4是本专利技术实施例五提供的逾期预测模型生成方法的实现流程示意图;图5是本专利技术实施例六提供的逾期预测模型生成装置的结构示意图;图6是本专利技术实施例七提供的逾期预测模型生成终端设备的示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。图1示出了本专利技术实施例一提供的逾期预测模型生成方法的实现流程图,详述如下:S101,获取M个用户的L种用户属性数据以及逾期类别标签,得到维度为M×(L+1)的输入矩阵,其中,M和L均为正整数。其中,用户属性数据是指用户的年龄、性别、职业、个人年收入、家庭年收入、贷款情况以及居住情况等用户个人信息,这些用户属性数据可由技术人员手动输入或者从借贷公司已存储的用户个人信息中选取得到。其中,考虑到每家借贷公司对用户借款时要求提供的用户个人信息可能会有所不同,且不同借贷产品所需的审核记录的用户个人信息也可能有所差异,如小额借贷产品相对大额借贷产品所需的用户个人信息更少,因此,本专利技术实施例未对L种用户属性数据的数量L以及具体包含的用户个人信息的种类均进行限定,可由技术人员根据实际需求进行选取。逾期类别标签,是指对用户是否存在过逾期行为的记录标签,包括未存在逾期行为以及存在逾期行为两种类别,实际应用中可以使用汉字/英文/数字等形式来记录标签,如使用“0”表示未存在逾期行为,使用“1”表示存在逾期行为以节省内存。其中,由于本专利技术实施例既可以用于对用户单个/单类借贷产品是否会逾期的预测,也可以用于对用户全类借贷产品是否会逾期的预测,因此本专利技术实施例中的逾期类别标签,既可以是用户单个/单类借贷产品是否存在过逾期行为的记录标签,如用户对小额借贷产品是否存在过逾期行为的记录标签,也本文档来自技高网...

【技术保护点】
1.一种逾期预测模型生成方法,其特征在于,包括:获取M个用户的L种用户属性数据以及逾期类别标签,得到维度为M×(L+1)的输入矩阵,其中,M和L均为正整数;将所述输入矩阵输入到预设的学习模型中,筛选出与所述逾期类别标签关联度最大的N种用户属性数据,所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型,其中,N为小于或等于L的正整数;对所述M个用户进行随机分组,得到用户数Ph随机的H个用户组,并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵,其中,Ph为正整数,H为大于1的正整数,h∈[1,H];将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件,确定出所述H个神经网络模型分别对应的模型参数,得到H个子预测模型;根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数,并基于所述H个子预测模型以及分别对应的所述H个投票系数,构建得到逾期预测模型:Presult=Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中,Presult为所述逾期预测模型的输出结果,Vresulth为第h个所述子预测模型的输出结果,Vcoenth为第h个所述子预测模型对应的所述投票系数。...

【技术特征摘要】
1.一种逾期预测模型生成方法,其特征在于,包括:获取M个用户的L种用户属性数据以及逾期类别标签,得到维度为M×(L+1)的输入矩阵,其中,M和L均为正整数;将所述输入矩阵输入到预设的学习模型中,筛选出与所述逾期类别标签关联度最大的N种用户属性数据,所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型,其中,N为小于或等于L的正整数;对所述M个用户进行随机分组,得到用户数Ph随机的H个用户组,并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵,其中,Ph为正整数,H为大于1的正整数,h∈[1,H];将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件,确定出所述H个神经网络模型分别对应的模型参数,得到H个子预测模型;根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数,并基于所述H个子预测模型以及分别对应的所述H个投票系数,构建得到逾期预测模型:Presult=Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中,Presult为所述逾期预测模型的输出结果,Vresulth为第h个所述子预测模型的输出结果,Vcoenth为第h个所述子预测模型对应的所述投票系数。2.如权利要求1所述的逾期预测模型生成方法,其特征在于,所述学习模型的处理过程包括:基于所述逾期类别标签计算所述M个用户对应的信息熵;对所述L种用户属性数据进行二维化处理,并计算所述L种用户属性数据对应的划分信息熵以及分裂信息;基于所述信息熵以及所述划分信息熵计算所述M个用户对应的信息增益;基于所述分裂信息以及所述信息增益计算所述L种用户属性数据对应的信息增益率;从所述L种用户属性数据随机选取出I至L-1种用户属性数据,并基于所述随机选取得到的组用户属性数据,返回执行所述基于所述逾期类别标签计算所述M个用户对应的信息熵的操作,以得到对应的共个信息增益率,其中I为小于或等于L-1的正整数;查找出所述个信息增益率中最大的所述信息增益率对应的所述用户属性数据,以确定出所述N种用户属性数据。3.如权利要求1所述的逾期预测模型生成方法,其特征在于,所述对所述M个用户进行随机分组,得到用户数Ph随机的H个用户组,包括:若M大于或等于用户数阈值,采用可放回式或者不可放回式的抽样方法来对所述M个用户进行随机抽样,以实现对所述M个用户的随机分组,得到包含用户数随机的所述H个用户组;若M小于所述用户数阈值,采用可放回式的抽样方法来对所述M个用户进行随机抽样,以实现对所述M个用户的随机分组,得到包含用户数随机的所述H个用户组。4.如权利要求1所述的逾期预测模型生成方法,其特征在于,在所述得到逾期预测模型之后,还包括:获取预设时间段内所述输出逾期预测模型的预测准确率,并判断所述预测准确率是否小于准确率阈值;若判断结果为所述预测准确率小于所述准确率阈值,获取T个用户的所述N种用户属性数据以及逾期类别标签,得到维度为T×(N+1)的样本矩阵,其中,T为正整数;对所述T个用户进行随机分组,得到用户数Ph随机的H个用户组,并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵,其中,Ph为正整数,H为大于1的正整数,h∈[1,H];返回执行所述将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件,确定出所述H个神经网络模型分别对应的模型参数,得到H个子预测模型的操作,以对所述逾期预测模型进行模型更新。5.如权利要求4所述的逾期预测模型生成方法,其特征在于,所述获取预设时间段内所述输出逾期预测模型的预测准确率,并判断所述预测准确率是否小于准确率阈值,包括:解析用户输入的借贷产品选取指令所指向的借贷产品类型;从获取到的所述预设时间段内所述输出逾期预测模型的预测准确率中,解析出所述借贷产品类型对应的预测准确率;判断所述借贷产品类型对应的预测准确率...

【专利技术属性】
技术研发人员:盘兵
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1