信贷逾期风险预测方法及装置制造方法及图纸

技术编号:28422683 阅读:27 留言:0更新日期:2021-05-11 18:30
本申请实施例提供一种信贷逾期风险预测方法及装置,可用于人工智能技术领域,方法包括:基于目标用户的信贷数据生成对应的目标信贷特征向量;将目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定目标用户的信贷逾期风险预测结果;信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据。本申请能够提高训练信贷逾期风险预测模型而使用的训练用数据的分布均匀性,能够有效提高训练得到的信贷逾期风险预测模型的准确性、可靠性及有效性,进而能够有效提高信贷逾期风险预测的准确性及有效性。

【技术实现步骤摘要】
信贷逾期风险预测方法及装置
本申请涉及数据处理
,特别涉及人工智能
,具体涉及信贷逾期风险预测方法及装置。
技术介绍
在信贷业务中,金融用户的资质和还款能力直接决定了银行等金融机构所要承担的金融风险的大小。而由于部分地区的征信体系尚未完善,因此金融机构在对金融用户进行信用等级评定的时候,除了参考个人信贷征信报告,还需要依赖于金融用户自行提供的基本资料和资产信息,这种评估方法不仅会存在部分金融用户填报虚假资产,或者利用借款的方式通过审核,而且需要专业的资料审核人分析判断,耗时费力且准确率不高,这就会导致贷款逾期或信用卡违约行为的发生。目前,现有技术可以实现对信贷行为违约的预测,以提高信贷逾期风险预警的自动化程度,例如基于统计学、运筹学以及人工智能方法等,然而,这些相对自动化的方式虽然都表明其具有良好的信贷风险预测能力,但却忽视了待分析数据集自身存在的缺陷,即实际信用风险评估中的数据种类繁多且呈现非结构化,特别是存在数据类别不平衡问题。例如:将信贷客户等级评估问题转化为二分类问题,假设有100个信贷客户,其中信用等级好为98个,信用等级差为2个,就算我们采用的学习算法一直将待评估客户预测为信用等级好时,分类准确率也能达到98%,也就是说多数类的数据直接影响了分类算法的性能,这样由非平衡数据集训练的学习算法是没有价值和意义的,不能验证整个风险预测模型的有效性。因此,在研究实际信贷逾期风险预测问题上,如何有效地解决待训练数据的非平衡问题,对于提升信贷风险预测的准确性和可靠性至关重要。>
技术实现思路
针对现有技术中的问题,本申请提供一种信贷逾期风险预测方法及装置,能够提高训练信贷逾期风险预测模型而使用的训练用数据的分布均匀性,能够有效提高训练得到的信贷逾期风险预测模型的准确性、可靠性及有效性,进而能够有效提高信贷逾期风险预测的准确性及有效性。为解决上述技术问题,本申请提供以下技术方案:第一方面,本申请提供一种信贷逾期风险预测方法,包括:基于目标用户的信贷数据生成对应的目标信贷特征向量;将所述目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定所述目标用户的信贷逾期风险预测结果;其中,所述信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且所述平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据。进一步地,在所述将所述目标信贷特征向量输入预设的信贷逾期风险预测模型之前,还包括:获取多个历史用户各自对应的历史信贷数据及标签,其中,所述标签包括:用于表示对应的历史用户存在信贷逾期风险的第一标签和用于表示对应的历史用户不存在信贷逾期风险的第二标签;根据各个所述历史用户各自对应的历史信贷数据及标签生成对应的第一数据集,并将所述第一数据集划分为训练集和测试集;若所述训练集中的数据为非平衡历史数据,则对所述训练集进行数据平衡处理以使所述训练集中的数据转换为平衡历史信贷数据并形成第二数据集;应用所述第二数据集获取对应的信贷特征向量;基于所述信贷特征向量训练得到所述信贷逾期风险预测模型。进一步地,在所述将所述第一数据集划分为训练集和测试集之前,还包括:对各个所述历史用户各自对应的历史信贷数据进行预处理,其中,所述预处理包括:对缺失数据进行补全处理和对异常及无效数据进行删除处理中的至少一项。进一步地,在所述若所述训练集中的数据为非平衡历史数据,则对所述训练集进行数据平衡处理以使所述训练集中的数据转换为平衡历史信贷数据并形成第二数据集之前,还包括:若所述训练集中对应所述第一标签的历史用户总数与对应所述第二标签的历史用户总数的比值大于第一阈值或者小于第二阈值,则确定所述训练集中的数据为非平衡历史数据,其中,所述第一阈值大于1,所述第二阈值大于0且小于1。进一步地,所述对所述训练集进行数据平衡处理以使所述训练集中的数据转换为平衡历史信贷数据并形成第二数据集,包括:根据所述训练集中对应所述第一标签的历史用户总数与对应所述第二标签的历史用户总数,确定所述训练集中的少数类数据和多数类数据;应用预设的数据均衡方式对所述少数类数据进行K近邻插值处理,并对所述多数类数据进行K均值聚类处理,以使所述训练集中的数据转换为平衡历史信贷数据并形成对应的第二数据集;其中,所述数据均衡方式包括:预设的SMOTE算法。进一步地,所述应用所述第二数据集获取对应的信贷特征向量,包括:对所述第二数据集进行数据降维及特征筛选处理,以得到各个所述历史用户和经数据平衡处理得到的虚拟用户各自对应的信贷特征向量。进一步地,所述基于所述信贷特征向量训练得到所述信贷逾期风险预测模型,包括:应用预设的随机森林算法,基于所述信贷特征向量训练得到初始预测模型;根据所述测试集对应的评估指标对所述初始预测模型进行效果评估,并基于对应的效果评估结果调整所述初始预测模型,以得到对应的信贷逾期风险预测模型。第二方面,本申请提供一种信贷逾期风险预测装置,包括:向量生成模块,用于基于目标用户的信贷数据生成对应的目标信贷特征向量;模型预测模块,用于将所述目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定所述目标用户的信贷逾期风险预测结果;其中,所述信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且所述平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据。第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述信贷逾期风险预测方法。第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述信贷逾期风险预测方法。由上述技术方案可知,本申请提供的一种信贷逾期风险预测方法及装置,方法通过基于目标用户的信贷数据生成对应的目标信贷特征向量;将目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定目标用户的信贷逾期风险预测结果;信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据,针对预先获取的非平衡历史数据进行数据平衡处理,能够有效提高训练所述信贷逾期风险预测模型而使用的训练用数据的分布均匀性,能够有效提高训练得到的信贷逾期风险预测模型的准确性、可靠性及有效性,进而能够有效提高信贷逾期风险预测的准确性及有效性,为银行等金融机构提供了更为准确且可靠地的判定依据,以对信贷逾期风险进行提前预警处理或风控处理,进而有效降低用户的信贷逾期风险,提高金融机构的用户体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申本文档来自技高网...

【技术保护点】
1.一种信贷逾期风险预测方法,其特征在于,包括:/n基于目标用户的信贷数据生成对应的目标信贷特征向量;/n将所述目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定所述目标用户的信贷逾期风险预测结果;/n其中,所述信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且所述平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据。/n

【技术特征摘要】
1.一种信贷逾期风险预测方法,其特征在于,包括:
基于目标用户的信贷数据生成对应的目标信贷特征向量;
将所述目标信贷特征向量输入预设的信贷逾期风险预测模型,并基于该信贷逾期风险预测模型的输出确定所述目标用户的信贷逾期风险预测结果;
其中,所述信贷逾期风险预测模型预先基于平衡历史信贷数据训练得到,且所述平衡历史信贷数据为对预先获取的非平衡历史数据进行数据平衡处理后得到的数据。


2.根据权利要求1所述的信贷逾期风险预测方法,其特征在于,在所述将所述目标信贷特征向量输入预设的信贷逾期风险预测模型之前,还包括:
获取多个历史用户各自对应的历史信贷数据及标签,其中,所述标签包括:用于表示对应的历史用户存在信贷逾期风险的第一标签和用于表示对应的历史用户不存在信贷逾期风险的第二标签;
根据各个所述历史用户各自对应的历史信贷数据及标签生成对应的第一数据集,并将所述第一数据集划分为训练集和测试集;
若所述训练集中的数据为非平衡历史数据,则对所述训练集进行数据平衡处理以使所述训练集中的数据转换为平衡历史信贷数据并形成第二数据集;
应用所述第二数据集获取对应的信贷特征向量;
基于所述信贷特征向量训练得到所述信贷逾期风险预测模型。


3.根据权利要求2所述的信贷逾期风险预测方法,其特征在于,在所述将所述第一数据集划分为训练集和测试集之前,还包括:
对各个所述历史用户各自对应的历史信贷数据进行预处理,其中,所述预处理包括:对缺失数据进行补全处理和对异常及无效数据进行删除处理中的至少一项。


4.根据权利要求2所述的信贷逾期风险预测方法,其特征在于,在所述若所述训练集中的数据为非平衡历史数据,则对所述训练集进行数据平衡处理以使所述训练集中的数据转换为平衡历史信贷数据并形成第二数据集之前,还包括:
若所述训练集中对应所述第一标签的历史用户总数与对应所述第二标签的历史用户总数的比值大于第一阈值或者小于第二阈值,则确定所述训练集中的数据为非平衡历史数据,其中,所述第一阈值大于1,所述第二阈值大于0且小于1。


5.根据权利要求2所述的信贷逾期风险预测方法,其特征在于,所...

【专利技术属性】
技术研发人员:邓佳颖谢联民肖迪汪硕文
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1