信贷风险识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:37334344 阅读:20 留言:0更新日期:2023-04-21 23:12
本申请提供一种信贷风险识别方法、装置、设备及计算机可读存储介质,信贷风险识别方法包括:获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列;对用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;将第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据行为序列表征数据,对用户的信贷风险进行识别。本申请能够提高信贷风险识别的准确率。率。率。

【技术实现步骤摘要】
信贷风险识别方法、装置、设备及计算机可读存储介质


[0001]本申请涉及金融科技(Fintech)
,尤其涉及一种信贷风险识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]在金融信贷行业,出资方往往需要评估客户是否会有违约或者欺诈的风险,并基于此来判断是否给客户贷款。
[0003]目前,在信贷场景中,对于借款人的行为序列,例如带时间前后关系的账户开立、贷款查询、历史还款记录等信息维度,最常见的信贷风险识别方式是对于每个信息维度,采用固定的时间窗口进行特征提取,将其同样处理为结构化数据,再进行后续的建模处理。也即,目前的信贷风险识别方式是基于单维度的行为时间序列,根据时间窗口和聚合函数衍生成结构化的特征,输入到决策树、集成树的模型中进行不同特征的交互。
[0004]然而,目前的该信贷风险识别方式,将借款人的行为序列处理为结构化特征往往会面临以下方面的问题:一是信息缺失。常用的聚合方式,如平均、比值、标准差等,都是对原始信息进行了聚合处理,这些操作不可避免会损失一部分最原始的数据信息。
[0005]二是数据稀疏程度高。在将非结构化的行为序列处理成结构化信息的时候,由于不同借款人的行为序列存在巨大差异,会导致最终的聚合特征有着很高的缺失占比。
[0006]三是忽略了行为间的交互作用和行为的顺序信息,比如两个客户都是近6月有3次借款和3次还款,其中一个是先借3笔,然后还上,另外一个是每次还款之前都需要再次借款,从这个维度上考虑,后者的信贷风险明显比前者高。但是如果按照传统的特征衍生方式,将无法识别这两个客户的行为差异。
[0007]因此,如何克服上述问题,提高信贷风险识别的准确率,已成为金融信贷领域亟待解决的技术问题。

技术实现思路

[0008]本申请的主要目的在于提供一种信贷风险识别方法、装置、设备及计算机可读存储介质,旨在提高信贷风险识别的准确率。
[0009]为实现上述目的,本申请提供一种信贷风险识别方法,所述信贷风险识别方法包括:获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列,其中,所述历史行为数据为表征历史信贷行为的非结构化数据,所述用户行为序列包括行为特征,以及各所述行为特征的时序信息;对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对所述第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;
将所述第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据所述行为序列表征数据,对所述用户的信贷风险进行识别。
[0010]在一些实施例中,所述对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量的步骤包括:根据预设的行为动作字典,将所述用户行为序列中的各行为特征映射为行为编码,得到行为编码序列;将所述行为编码序列进行One

hot编码,得到第一行为序列编码向量。
[0011]在一些实施例中,所述根据所述行为序列表征数据,对所述用户的信贷风险进行识别的步骤包括:获取所述用户的结构表征数据,其中,所述结构表征数据为表征用户属性特征的结构化数据;通过预设分类算法,将所述结构表征数据和所述行为序列表征数据进行融合,得到融合表征数据,共同训练信贷风险模型;将所述融合表征数据输入至训练完毕的信贷风险模型,预测得到所述用户的违约概率,并根据所述违约概率,对所述用户的信贷风险进行识别。
[0012]在一些实施例中,在所述将所述融合表征数据输入至训练完毕的信贷风险模型的步骤之前,所述方法还包括:获取行为序列样本数据和结构样本数据,并将所述行为序列样本数据和所述结构样本数据进行融合,得到训练集和验证集,其中,所述行为序列样本数据为表征历史信贷行为的样本数据,所述结构样本数据为表征用户属性特征的样本数据;基于所述训练集,对信贷风险模型进行迭代训练,并根据所述验证集,对信贷风险模型的效果进行评估,得到判定结果;若所述判定结果不满足预设标准,则继续对信贷风险模型进行迭代训练;若所述判定结果满足预设标准,结束迭代训练,得到训练完毕的信贷风险模型。
[0013]在一些实施例中,所述将所述行为序列样本数据和所述结构样本数据进行融合,得到训练集和验证集的步骤包括:通过预设分类算法,将所述行为序列样本数据和所述结构样本数据进行融合,得到融合样本集,其中,所述融合样本集中包括多个训练样本,以及各训练样本关联的违约标签;将所述融合样本集按照预设比例划分为训练集和验证集。
[0014]在一些实施例中,所述预设分类算法为逻辑回归算法。
[0015]在一些实施例中,在所述将所述第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据的步骤之前,所述方法还包括:基于长短期记忆网络LSTM算法训练得到所述循环神经网络模型。
[0016]此外,本申请提供一种信贷风险识别装置,所述信贷风险识别装置包括:行为序列提取模块,用于获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列,其中,所述历史行为数据为表征历史信贷行为的非结构化数据,所述用户行为序列包括行为特征,以及各所述行为特征
的时序信息;非结构化数据处理模块,用于对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对所述第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;行为序列表征模块,用于将所述第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;信贷风险识别模块,用于根据所述行为序列表征数据,对所述用户的信贷风险进行识别。
[0017]此外,为实现上述目的,本申请还提供一种信贷风险识别设备,信贷风险识别设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的信贷风险识别程序,信贷风险识别程序被处理器执行时实现如上述的信贷风险识别方法的步骤。
[0018]本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有信贷风险识别程序,信贷风险识别程序被处理器执行时实现如上述的信贷风险识别方法的步骤。
[0019]本申请的技术方案是通过获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列,其中,该历史行为数据为表征历史信贷行为的非结构化数据,用户行为序列包括行为特征,以及各行为特征的时序信息;对用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;将第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据行为序列表征数据,对用户的信贷风险进行识别。
[0020]也即,本申请通过提取原始的行为序列,并基于非结构化数据运用自然语言处理、稀疏数据处理等技术对非结构化数据进行转化,作为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信贷风险识别方法,其特征在于,所述信贷风险识别方法包括:获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列,其中,所述历史行为数据为表征历史信贷行为的非结构化数据,所述用户行为序列包括行为特征,以及各所述行为特征的时序信息;对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对所述第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;将所述第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据所述行为序列表征数据,对所述用户的信贷风险进行识别。2.如权利要求1所述的信贷风险识别方法,其特征在于,所述对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量的步骤包括:根据预设的行为动作字典,将所述用户行为序列中的各行为特征映射为行为编码,得到行为编码序列;将所述行为编码序列进行One

hot编码,得到第一行为序列编码向量。3.如权利要求1所述的信贷风险识别方法,其特征在于,所述根据所述行为序列表征数据,对所述用户的信贷风险进行识别的步骤包括:获取所述用户的结构表征数据,其中,所述结构表征数据为表征用户属性特征的结构化数据;通过预设分类算法,将所述结构表征数据和所述行为序列表征数据进行融合,得到融合表征数据,共同训练信贷风险模型;将所述融合表征数据输入至训练完毕的信贷风险模型,预测得到所述用户的违约概率,并根据所述违约概率,对所述用户的信贷风险进行识别。4.如权利要求3所述的信贷风险识别方法,其特征在于,在所述将所述融合表征数据输入至训练完毕的信贷风险模型的步骤之前,所述方法还包括:获取行为序列样本数据和结构样本数据,并将所述行为序列样本数据和所述结构样本数据进行融合,得到训练集和验证集,其中,所述行为序列样本数据为表征历史信贷行为的样本数据,所述结构样本数据为表征用户属性特征的样本数据;基于所述训练集,对信贷风险模型进行迭代训练,并根据所述验证集,对信贷风险模型的效果进行评估,得到判定结果;若所述判定结果不满足预设标准,则继续对信贷风险模型进行迭代训练;若所...

【专利技术属性】
技术研发人员:黄茂湘壮青陈婷吴三平庄伟亮王永兴谭蕴琨要卓
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1