信贷风险识别方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:37334344 阅读:40 留言:0更新日期:2023-04-21 23:12
本申请提供一种信贷风险识别方法、装置、设备及计算机可读存储介质,信贷风险识别方法包括:获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列;对用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;将第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据行为序列表征数据,对用户的信贷风险进行识别。本申请能够提高信贷风险识别的准确率。率。率。

【技术实现步骤摘要】
信贷风险识别方法、装置、设备及计算机可读存储介质


[0001]本申请涉及金融科技(Fintech)
,尤其涉及一种信贷风险识别方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]在金融信贷行业,出资方往往需要评估客户是否会有违约或者欺诈的风险,并基于此来判断是否给客户贷款。
[0003]目前,在信贷场景中,对于借款人的行为序列,例如带时间前后关系的账户开立、贷款查询、历史还款记录等信息维度,最常见的信贷风险识别方式是对于每个信息维度,采用固定的时间窗口进行特征提取,将其同样处理为结构化数据,再进行后续的建模处理。也即,目前的信贷风险识别方式是基于单维度的行为时间序列,根据时间窗口和聚合函数衍生成结构化的特征,输入到决策树、集成树的模型中进行不同特征的交互。
[0004]然而,目前的该信贷风险识别方式,将借款人的行为序列处理为结构化特征往往会面临以下方面的问题:一是信息缺失。常用的聚合方式,如平均、比值、标准差等,都是对原始信息进行了聚合处理,这些操作不可避免会损失一部分最原始的数据信息。/>[0005]二是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信贷风险识别方法,其特征在于,所述信贷风险识别方法包括:获取用户的不同时间节点的历史行为数据,将各时间节点的历史行为数据按时序进行排序拼接,生成用户行为序列,其中,所述历史行为数据为表征历史信贷行为的非结构化数据,所述用户行为序列包括行为特征,以及各所述行为特征的时序信息;对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量,并对所述第一行为序列编码向量进行Embedding稀疏数据处理,得到低维稠密的第二行为序列编码向量;将所述第二行为序列编码向量输入至预先构建的循环神经网络模型,解码得到行为序列表征数据;根据所述行为序列表征数据,对所述用户的信贷风险进行识别。2.如权利要求1所述的信贷风险识别方法,其特征在于,所述对所述用户行为序列进行自然语言处理,得到第一行为序列编码向量的步骤包括:根据预设的行为动作字典,将所述用户行为序列中的各行为特征映射为行为编码,得到行为编码序列;将所述行为编码序列进行One

hot编码,得到第一行为序列编码向量。3.如权利要求1所述的信贷风险识别方法,其特征在于,所述根据所述行为序列表征数据,对所述用户的信贷风险进行识别的步骤包括:获取所述用户的结构表征数据,其中,所述结构表征数据为表征用户属性特征的结构化数据;通过预设分类算法,将所述结构表征数据和所述行为序列表征数据进行融合,得到融合表征数据,共同训练信贷风险模型;将所述融合表征数据输入至训练完毕的信贷风险模型,预测得到所述用户的违约概率,并根据所述违约概率,对所述用户的信贷风险进行识别。4.如权利要求3所述的信贷风险识别方法,其特征在于,在所述将所述融合表征数据输入至训练完毕的信贷风险模型的步骤之前,所述方法还包括:获取行为序列样本数据和结构样本数据,并将所述行为序列样本数据和所述结构样本数据进行融合,得到训练集和验证集,其中,所述行为序列样本数据为表征历史信贷行为的样本数据,所述结构样本数据为表征用户属性特征的样本数据;基于所述训练集,对信贷风险模型进行迭代训练,并根据所述验证集,对信贷风险模型的效果进行评估,得到判定结果;若所述判定结果不满足预设标准,则继续对信贷风险模型进行迭代训练;若所...

【专利技术属性】
技术研发人员:黄茂湘壮青陈婷吴三平庄伟亮王永兴谭蕴琨要卓
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1