一种逾期预测模型生成方法及终端设备技术

技术编号：19024169 阅读：16 留言：0更新日期：2018-09-26 19:15

本发明专利技术提供了一种逾期预测模型生成方法及终端设备，适用于数据处理技术领域，该方法包括：通过学习模型对用户属性数据进行筛选，得到与逾期类别标签关联度最大的N种用户属性数据；对用户进行随机分组得到多个用户数随机的训练样本矩阵，再分别进行训练得到对应的多个子预测模型；基于包含的用户数计算子预测模型的投票系数，并构建得到所需的逾期预测模型。本发明专利技术实施例实现了对用户逾期的高效准确的预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种逾期预测模型生成方法及终端设备
本专利技术属于数据处理
，尤其涉及逾期预测模型生成方法及终端设备。
技术介绍
现有技术中对用户贷款后的风险管理较为简单，都是被动式地获取用户是否逾期未还的结果，并在确定出用户逾期后再进行后续的催收或者理赔处理。然而当用户出现逾期未还的情况时，借贷公司已经遭受了一定的经济损失，同时对逾期的用户进行违约资金回收难度较大，使得借贷公司经济损失进一步地加重。综上，现有技术中无法实现对用户的逾期风险进行有效评估预测。
技术实现思路
有鉴于此，本专利技术实施例提供了一种逾期预测模型生成方法及终端设备，以解决现有技术中无法对用户的逾期风险进行有效评估预测的问题。本专利技术实施例的第一方面提供了一种逾期预测模型生成方法，包括：获取M个用户的L种用户属性数据以及逾期类别标签，得到维度为M×(L+1)的输入矩阵，其中，M和L均为正整数；将所述输入矩阵输入到预设的学习模型中，筛选出与所述逾期类别标签关联度最大的N种用户属性数据，所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型，其中，N为小于或等于L的正整数；对所述M个用户进行随机分组，得到用户数Ph随机的H个用户组，并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵，其中，Ph为正整数，H为大于1的正整数，h∈[1，H]；将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件，确定出所述H个神经网络模型分别对应的模型参数，得到H个子预测模型；根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数，并基于...

【技术保护点】
1.一种逾期预测模型生成方法，其特征在于，包括：获取M个用户的L种用户属性数据以及逾期类别标签，得到维度为M×(L+1)的输入矩阵，其中，M和L均为正整数；将所述输入矩阵输入到预设的学习模型中，筛选出与所述逾期类别标签关联度最大的N种用户属性数据，所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型，其中，N为小于或等于L的正整数；对所述M个用户进行随机分组，得到用户数Ph随机的H个用户组，并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵，其中，Ph为正整数，H为大于1的正整数，h∈[1，H]；将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件，确定出所述H个神经网络模型分别对应的模型参数，得到H个子预测模型；根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数，并基于所述H个子预测模型以及分别对应的所述H个投票系数，构建得到逾期预测模型：Presult＝Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中，P...

【技术特征摘要】
1.一种逾期预测模型生成方法，其特征在于，包括：获取M个用户的L种用户属性数据以及逾期类别标签，得到维度为M×(L+1)的输入矩阵，其中，M和L均为正整数；将所述输入矩阵输入到预设的学习模型中，筛选出与所述逾期类别标签关联度最大的N种用户属性数据，所述学习模型为进行用户属性与逾期类别标签关联度分析的学习模型，其中，N为小于或等于L的正整数；对所述M个用户进行随机分组，得到用户数Ph随机的H个用户组，并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵，其中，Ph为正整数，H为大于1的正整数，h∈[1，H]；将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件，确定出所述H个神经网络模型分别对应的模型参数，得到H个子预测模型；根据所述H个用户组包含的用户数Ph计算出所述H个子预测模型分别对应的H个投票系数，并基于所述H个子预测模型以及分别对应的所述H个投票系数，构建得到逾期预测模型：Presult＝Vcoent1Vresult1+Vcoent2Vresult2+…+VcoenthVresulth+…+VcoentHVresultH其中，Presult为所述逾期预测模型的输出结果，Vresulth为第h个所述子预测模型的输出结果，Vcoenth为第h个所述子预测模型对应的所述投票系数。2.如权利要求1所述的逾期预测模型生成方法，其特征在于，所述学习模型的处理过程包括：基于所述逾期类别标签计算所述M个用户对应的信息熵；对所述L种用户属性数据进行二维化处理，并计算所述L种用户属性数据对应的划分信息熵以及分裂信息；基于所述信息熵以及所述划分信息熵计算所述M个用户对应的信息增益；基于所述分裂信息以及所述信息增益计算所述L种用户属性数据对应的信息增益率；从所述L种用户属性数据随机选取出I至L-1种用户属性数据，并基于所述随机选取得到的组用户属性数据，返回执行所述基于所述逾期类别标签计算所述M个用户对应的信息熵的操作，以得到对应的共个信息增益率，其中I为小于或等于L-1的正整数；查找出所述个信息增益率中最大的所述信息增益率对应的所述用户属性数据，以确定出所述N种用户属性数据。3.如权利要求1所述的逾期预测模型生成方法，其特征在于，所述对所述M个用户进行随机分组，得到用户数Ph随机的H个用户组，包括：若M大于或等于用户数阈值，采用可放回式或者不可放回式的抽样方法来对所述M个用户进行随机抽样，以实现对所述M个用户的随机分组，得到包含用户数随机的所述H个用户组；若M小于所述用户数阈值，采用可放回式的抽样方法来对所述M个用户进行随机抽样，以实现对所述M个用户的随机分组，得到包含用户数随机的所述H个用户组。4.如权利要求1所述的逾期预测模型生成方法，其特征在于，在所述得到逾期预测模型之后，还包括：获取预设时间段内所述输出逾期预测模型的预测准确率，并判断所述预测准确率是否小于准确率阈值；若判断结果为所述预测准确率小于所述准确率阈值，获取T个用户的所述N种用户属性数据以及逾期类别标签，得到维度为T×(N+1)的样本矩阵，其中，T为正整数；对所述T个用户进行随机分组，得到用户数Ph随机的H个用户组，并生成所述H个用户组分别对应的维度为Ph×(N+1)的H个训练样本矩阵，其中，Ph为正整数，H为大于1的正整数，h∈[1，H]；返回执行所述将所述H个训练样本矩阵分别输入预设的H个神经网络模型中进行训练直至满足预设的收敛条件，确定出所述H个神经网络模型分别对应的模型参数，得到H个子预测模型的操作，以对所述逾期预测模型进行模型更新。5.如权利要求4所述的逾期预测模型生成方法，其特征在于，所述获取预设时间段内所述输出逾期预测模型的预测准确率，并判断所述预测准确率是否小于准确率阈值，包括：解析用户输入的借贷产品选取指令所指向的借贷产品类型；从获取到的所述预设时间段内所述输出逾期预测模型的预测准确率中，解析出所述借贷产品类型对应的预测准确率；判断所述借贷产品类型对应的预测准确率...

【专利技术属性】
技术研发人员：盘兵，
申请(专利权)人：平安普惠企业管理有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人