当前位置: 首页 > 专利查询>湖南大学专利>正文

信用风险预测方法、系统、终端及存储介质技术方案

技术编号:23934053 阅读:42 留言:0更新日期:2020-04-25 02:30
本发明专利技术公开了一种信用风险预测方法、系统、终端及存储介质,方法包括:采用已发生还款行为的用户的信息对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;采用初步训练的信用风险预测模型对贷款审核未通过的用户的信用风险等级进行预测,获得贷款审核未通过的用户的信用风险预测等级;将已发生还款行为用户的用户信息和对应的实际信用风险等级以及贷款审核未通过的用户的用户信息和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。本发明专利技术解决了现有信用评分模型中对对用户的信用风险的进行预测的准确率低问题。

Credit risk prediction method, system, terminal and storage medium

【技术实现步骤摘要】
信用风险预测方法、系统、终端及存储介质
本专利技术涉及人工智能
,尤其涉及一种信用风险预测方法、系统、终端及计算机可读存储介质。
技术介绍
近年来,随着互联网金融的不断发展,线上P2P贷款市场已经逐渐融入到人类的日常生活中。线上P2P贷款市场提供允许用户之间直接进行借贷交易的便利服务。但这种便利性也为用户尤其是投资者带来了巨大的潜在风险。因此,如何预测借款者的信用风险成为线上P2P贷款市场中亟待解决的问题。信用评分模型的出现在一定程度上缓解了该问题,但是传统的信用评分模型是基于被允许贷款的用户信息构建的,缺少了其他被拒绝贷款用户的信息,因此该模型对用户的信用风险预测仍然会存在偏差的,其风险预测的准确率低
技术实现思路
本专利技术的主要目的在于提出一种信用风险预测方法、系统、终端及计算机可读存储介质,旨在解决现有信用评分模型中对对用户的信用风险的进行预测的准确率低的技术问题。为实现上述目的,本专利技术提供一种信用风险预测方法,包括步骤:采集已发生还款行为的用户的信息作为第一样本,并根据用户的还款行为和信用风险等级间的预设映射关系,标注第一样本的实际信用风险等级;采集贷款审核未通过的用户信息作为第二样本;根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级;将多个第一样本和对应的实际信用风险等级以及多个第二样本和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。可选地,所述采集已发生还款行为的用户的信息作为第一样本的步骤包括:采集已发生还款行为的用户的信息;对已发生还款行为的用户信息进行中进行敏感信息过滤和/或预处理;将过滤后和/或预处理后的已发生还款行为的用户信息作为第一样本。可选地,所述采集贷款审核未通过的用户信息作为第二样本的步骤包括:采集贷款审核未通过的用户信息;对贷款审核未通过的用户信息进行中进行敏感信息过滤和/或预处理;将过滤后和/或预处理后的贷款审核未通过的用户信息作为第二样本。可选地,若待训练的信用风险预测模型包括至少一个预设的不同分类算法、至少一个预设的不同聚类算法以及待训练的融合算法,所述根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型的步骤包括:将多个第一样本同时分别输入至各预设的分类算法和各预设的聚类算法中,获得各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果,其中各预设分类算法输出的第一分类结果包括各第一样本属于各信用风险等级对应的概率以及各第一样本的信用风险预测等级,各预设聚类算法输出的第一聚类结果包括与预设信用风险等级数量相同数量的簇类、各簇类属于各信用风险等级对应的概率以及各第一样本所属簇类;根据预设的簇类实际概率矩阵、各第一样本的实际信用风险等级、各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果对待训练的融合算法进行训练,获得初步训练的融合算法。可选地,所述根据预设的簇类实际概率矩阵、各第一样本的实际信用风险等级、各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果对待训练的融合算法进行训练,获得初步训练的融合算法的步骤包括:根据各第一样本的实际信用风险等级,构建样本实际概率矩阵;根据各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果,构建样本预测平均概率矩阵、簇类预测平均概率矩阵、分布矩阵和同属度矩阵;将预设的簇类实际概率矩阵、样本实际概率矩阵、样本预测平均概率矩阵、簇类预测平均概率矩阵、分布矩阵和同属度矩阵输入至待训练的融合算法中,采用块坐标下降算法获取待训练的融合算法中的初步参数。可选地,所述根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型的步骤还包括:根据K-十折交叉验证方法以及多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型。可选地,所述采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级的步骤包括:将多个第二样本输入各预设的分类算法和各预设的聚类算法中,获得各预设分类算法分别输出的第二分类结果以及各预设聚类算法分别输出的第二聚类结果;将各预设分类算法分别输出的第二分类结果以及各预设聚类算法分别输出的第二聚类结果输入至初步训练的融合算法中,输出各第二样本的信用风险预测等级。此外,为实现上述目的,本专利技术还提供一种信用风险预测系统,所述系统包括:第一采集模块,用于采集已发生还款行为的用户的信息作为第一样本,并根据用户的还款行为和信用风险等级间的预设映射关系,标注第一样本的实际信用风险等级;第二采集模块,用于采集贷款审核未通过的用户信息作为第二样本;第一训练模块,用于根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;预测模块,用于采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级;第二训练模块,用于将多个第一样本和对应的实际信用风险等级以及多个第二样本和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。此外,为实现上述目的,本专利技术还提供一种终端,所述终端包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上所述的信用风险预测方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的信用风险预测方法的步骤。本专利技术提出的一种信用风险预测方法、系统、终端及计算机可读存储介质,通过采集已发生还款行为的用户的信息作为第一样本,并根据用户的还款行为和信用风险等级间的预设映射关系,标注第一样本的实际信用风险等级;采集贷款审核未通过的用户信息作为第二样本;根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级;将多个第一样本和对应的实际信用风险等级以及多个第二样本和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。在构建信用分析预测模型时,先使用了被允许贷款的用户信息对模型进行初步训练,再采用被允许贷款的用户信息和被拒绝贷款的用户信息一起共同对模型进行再次训练,获得的模型不仅对符合贷款条件的本文档来自技高网...

【技术保护点】
1.一种信用风险预测方法,其特征在于,所述方法包括步骤:/n采集已发生还款行为的用户的信息作为第一样本,并根据用户的还款行为和信用风险等级间的预设映射关系,标注第一样本的实际信用风险等级;/n采集贷款审核未通过的用户信息作为第二样本;/n根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;/n采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级;/n将多个第一样本和对应的实际信用风险等级以及多个第二样本和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。/n

【技术特征摘要】
1.一种信用风险预测方法,其特征在于,所述方法包括步骤:
采集已发生还款行为的用户的信息作为第一样本,并根据用户的还款行为和信用风险等级间的预设映射关系,标注第一样本的实际信用风险等级;
采集贷款审核未通过的用户信息作为第二样本;
根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型;
采用初步训练的信用风险预测模型对第二样本的信用风险等级进行预测,获得第二样本的信用风险预测等级;
将多个第一样本和对应的实际信用风险等级以及多个第二样本和对应的信用风险预测等级,对初步训练的信用风险预测模型进行训练,获得最终的信用分析预测模型。


2.根据权利要求1所述的信用风险预测方法,其特征在于,所述采集已发生还款行为的用户的信息作为第一样本的步骤包括:
采集已发生还款行为的用户的信息;
对已发生还款行为的用户信息进行中进行敏感信息过滤和/或预处理;
将过滤后和/或预处理后的已发生还款行为的用户信息作为第一样本。


3.根据权利要求1所述的信用风险预测方法,其特征在于,所述采集贷款审核未通过的用户信息作为第二样本的步骤包括:
采集贷款审核未通过的用户信息;
对贷款审核未通过的用户信息进行中进行敏感信息过滤和/或预处理;
将过滤后和/或预处理后的贷款审核未通过的用户信息作为第二样本。


4.根据权利要求1-3任一项所述的信用风险预测方法,其特征在于,若待训练的信用风险预测模型包括至少一个预设的不同分类算法、至少一个预设的不同聚类算法以及待训练的融合算法,所述根据多个第一样本和对应的实际信用风险等级对待训练的信用风险预测模型进行训练,获得初步训练的信用风险预测模型的步骤包括:
将多个第一样本同时分别输入至各预设的分类算法和各预设的聚类算法中,获得各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果,其中各预设分类算法输出的第一分类结果包括各第一样本属于各信用风险等级对应的概率以及各第一样本的信用风险预测等级,各预设聚类算法输出的第一聚类结果包括与预设信用风险等级数量相同数量的簇类、各簇类属于各信用风险等级对应的概率以及各第一样本所属簇类;
根据预设的簇类实际概率矩阵、各第一样本的实际信用风险等级、各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果对待训练的融合算法进行训练,获得初步训练的融合算法。


5.根据权利要求4所述的信用风险预测方法,其特征在于,所述根据预设的簇类实际概率矩阵、各第一样本的实际信用风险等级、各预设分类算法输出的第一分类结果以及各预设聚类算法输出的第一聚类结果对待训练的融合算法进行训练,获得初步训练的融合...

【专利技术属性】
技术研发人员:李心儿刘彦张在美谢国琪
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1