一种贷款风险预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37748413 阅读:14 留言:0更新日期:2023-06-05 23:34
本申请提供一种贷款风险预测方法、装置、电子设备及存储介质,该方法包括:获取用户数据,用户数据包括非结构化用户数据和结构化用户数据;将用户数据输入预设的风险预测模型,获得风险预测结果;风险预测模型包括第一子模型和第二子模型;第一子模型为通过对非结构化训练数据进行训练获得的;第二子模型为通过第一子模型获得数据特征,并对数据特征和结构化训练数据进行训练获得的。第一子模型用于非结构化数据中的信息提取,通过将第一子模型输出的数据特征输入第二子模型,获得风险预测结果。提高非结构化数据中的信息利用率的同时,有效利用逻辑回归或集成决策树的可解释性,提高风险预测模型的风险评估和预测能力。高风险预测模型的风险评估和预测能力。高风险预测模型的风险评估和预测能力。

【技术实现步骤摘要】
一种贷款风险预测方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,具体而言,涉及一种贷款风险预测方法、装置、电子设备及存储介质。

技术介绍

[0002]贷款风险控制是指在贷款还款过程中,通过算法分析借款人的信用数据和还款行为,预测借款人可能出现还款问题的风险。由于贷款业务形式数量巨大,且风险形式多样,因此风险控制是这类业务的核心基础。目前大部分企业是通过风险策略模型或人工进行风险控制,对用户在借款时填写的信息进行分析和整理,从而进行贷款风险的预测。这种方式无法充分利用数据的特点和信息,导致预测精度较低。

技术实现思路

[0003]本专利技术实施例的目的在于一种贷款风险预测方法、装置、电子设备及存储介质,利用灵活选取结构各异的数据训练风险预测模型,扩充特征的维度,提高风险预测模型的预测能力。
[0004]第一方面,本申请实施例提供了一种贷款风险预测方法,包括:获取用户数据,用户数据包括非结构化用户数据和结构化用户数据;将用户数据输入预设的风险预测模型,获得风险预测结果;风险预测模型包括第一子模型和第二子模型;第一子模型为通过对非结构化训练数据进行训练获得的;第二子模型为通过第一子模型获得数据特征,并对数据特征和结构化训练数据进行训练获得的。
[0005]在上述的实现过程中,风险预测模型包括第一子模型和第二子模型,第一子模型用于非结构化数据中的信息提取,将通过第一子模型输出的数据特征输入第二子模型,获得风险预测结果。提高非结构化数据中的信息利用率的同时,有效利用逻辑回归或集成决策树的可解释性,提高风险预测模型的风险评估和预测能力。
[0006]可选的,在本申请实施例中,非结构化训练数据包括第一非结构化训练数据和第二非结构化训练数据;在将用户数据输入预设的风险预测模型,获得风险预测结果之前,方法还包括:通过第一非结构化训练数据,对预设的神经网络进行训练,获得第一子模型;将第二非结构化训练数据输入第一子模型,获得数据特征;通过数据特征和结构化训练数据,对预设的元模型进行训练,获得第二子模型。
[0007]在上述的实现过程中,风险预测模型包括第一子模型和第二子模型,利用非结构化训练数据训练第一子模型,利用结构化训练数据训练第二子模型,可以根据风控业务需求,灵活选取结构各异的数据训练风险预测模型,提高风险预测模型的预测能力,实现在较为复杂的情况下进行准确的风险预测。
[0008]可选的,在本申请实施例中,通过第一非结构化训练数据,对预设的神经网络进行训练,获得第一子模型,包括:基于第一非结构化训练数据,获得向量序列;将向量序列添加对应的标签;通过添加标签后的向量序列,训练神经网络,获得第一子模型。
[0009]在上述的实现过程中,通过第一非结构化训练数据,对预设的神经网络进行训练,获得第一子模型。使用神经网络来充分利用高维度数据,在原有的结构化特征的基础上,扩充特征的维度。使风险预测模型能使用的数据范围大幅扩大,提高风险预测的准确性。
[0010]可选的,在本申请实施例中,第一非结构化训练数据包括事件序列数据;向量序列包括事件向量序列;基于第一非结构化训练数据,获得向量序列,包括:获得事件序列数据的属性信息;基于事件序列数据对应的属性信息,和前一个事件序列数据对应的属性信息,获得事件序列数据的衍生属性信息;将事件序列数据的属性信息和衍生属性信息进行拼接,生成事件序列数据的特征向量;将每一事件序列数据的特征向量按照时间顺序进行拼接,获得事件向量序列。
[0011]在上述的实现过程中,通过收集和整合多种来源和不同类型的数据,对事件序列数据进行分析,发现隐藏在数据中的信息,实现对客户的多维度评估,提高模型的精度。
[0012]可选的,在本申请实施例中,向量序列包括行为向量序列;基于第一非结构化训练数据,获得向量序列,包括:获得行为序列数据对应的行为时间信息;根据行为时间信息将行为序列数据进行拼接,获得行为向量序列。
[0013]在上述的实现过程中,深度利用行为序列数据等高维度复杂结构的数据,提高模型的适用性和准确率。
[0014]可选的,在本申请实施例中,通过数据特征和结构化训练数据,对预设的元模型进行训练,获得第二子模型,包括:通过预设的特征生成规则,基于结构化训练数据,生成结构化训练数据特征;将数据特征和结构化训练数据特征加入特征池;对特征池中的数据特征和结构化训练数据特征进行筛选,获得入模特征;通过入模特征对元模型进行训练,获得第二子模型。
[0015]在上述的实现过程中,通过分步训练第一子模型和第二子模型,风险预测模型为融合了第一子模型和第二子模型的堆叠模型;同时第二子模型融入了基于规则衍生的具有可解释性的特征,使模型保留了一定程度的可解释性,提高了风险预测模型预测风险的准确性。
[0016]可选的,在本申请实施例中,将用户数据输入预设的风险预测模型,获得风险预测结果,包括:将非结构化用户数据输入第一子模型,获得非结构化用户数据特征;基于结构化用户数据,生成结构化用户数据特征;将非结构化用户数据特征和结构化用户数据特征进行拼接,生成拼接特征;将拼接特征输入第二子模型,获得风险预测结果。
[0017]在上述的实现过程中,通过将非结构化用户数据特征和结构化用户数据特征进行拼接,生成拼接特征;将拼接特征输入第二子模型,获得风险预测结果。充分利用非结构化用户数据特征,在原有的结构化特征的基础上,扩充特征的维度。使信用和欺诈的综合风险得到精准控制。
[0018]第二方面,本申请实施例还提供了一种贷款风险预测装置,包括:获取模块,用于获取用户数据,用户数据包括非结构化用户数据和结构化用户数据;预测模块,用于将用户数据输入预设的风险预测模型,获得风险预测结果;风险预测模型包括第一子模型和第二子模型;第一子模型为通过对非结构化训练数据进行训练获得的;第二子模型为通过第一子模型获得数据特征,并对数据特征和结构化训练数据进行训练获得的。
[0019]第三方面,本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器
存储有处理器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。
[0020]第四方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上面描述的方法。
[0021]采用本申请提供贷款风险预测方法、装置、电子设备及存储介质,风险预测模型包括第一子模型和第二子模型,第一子模型用于非结构化数据中的信息提取,通过将第一子模型输出的数据特征输入第二子模型,获得风险预测结果。提高非结构化数据中的信息利用率的同时,有效利用逻辑回归或集成决策树的可解释性,提高风险预测模型的风险评估和预测能力,实现在较为复杂的情况下进行准确的风险预测。
附图说明
[0022]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种贷款风险预测方法,其特征在于,包括:获取用户数据,所述用户数据包括非结构化用户数据和结构化用户数据;将所述用户数据输入预设的风险预测模型,获得风险预测结果;所述风险预测模型包括第一子模型和第二子模型;所述第一子模型为通过对非结构化训练数据进行训练获得的;所述第二子模型为通过所述第一子模型获得数据特征,并对所述数据特征和结构化训练数据进行训练获得的。2.根据权利要求1所述的方法,其特征在于,非结构化训练数据包括第一非结构化训练数据和第二非结构化训练数据;在将所述用户数据输入预设的风险预测模型,获得风险预测结果之前,所述方法还包括:通过所述第一非结构化训练数据,对预设的神经网络进行训练,获得所述第一子模型;将所述第二非结构化训练数据输入所述第一子模型,获得所述数据特征;通过所述数据特征和所述结构化训练数据,对预设的元模型进行训练,获得所述第二子模型。3.根据权利要求2所述的方法,其特征在于,通过所述第一非结构化训练数据,对预设的神经网络进行训练,获得所述第一子模型,包括:基于所述第一非结构化训练数据,获得向量序列;将所述向量序列添加对应的标签;通过添加标签后的所述向量序列,训练所述神经网络,获得所述第一子模型。4.根据权利要求3所述的方法,其特征在于,所述第一非结构化训练数据包括事件序列数据;所述向量序列包括事件向量序列;基于所述第一非结构化训练数据,获得向量序列,包括:获得所述事件序列数据的属性信息;基于所述事件序列数据对应的属性信息,和前一个所述事件序列数据对应的属性信息,获得所述事件序列数据的衍生属性信息;将所述事件序列数据的属性信息和所述衍生属性信息进行拼接,生成所述事件序列数据的特征向量;将每一所述事件序列数据的特征向量按照时间顺序进行拼接,获得所述事件向量序列。5.根据权利要求3所述的方法,其特征在于,所述第一非结构化训练数据包括行为序列数据;所述向量序列包括行为向量序列;基于所述第一非结构化训...

【专利技术属性】
技术研发人员:甘元笛刘洪江任晓东陈昱任吕文勇周智杰
申请(专利权)人:成都新希望金融信息有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1