一种基于LSTM的借贷风险时效性预测系统及方法技术方案

技术编号:24209967 阅读:15 留言:0更新日期:2020-05-20 16:24
本发明专利技术提供了一种基于LSTM的借贷风险时效性预测系统,包括依次连接的服务器存储模块、长短记忆LSTM模块、强学习器GBDT训练模块、参数存储模块以及服务器选择模块。基于上述系统,本发明专利技术还公开了一种基于LSTM的借贷风险时效性预测方法。本发明专利技术通过结合用户时效性数据,对借贷用户的个人固定资产、身份信息和行为特点进行统计分析,使用LSTM以及GBDT进行回归预测,以确定在符合用户个人属性及行为特征的基础上,能够根据用户的个人信息以及行为历史进行分析,对再次借款时可能发生风险的几率进行预测,从而提供给金融机构推荐此次借贷交易的结果,降低借贷风险。

A prediction system and method of loan risk timeliness based on LSTM

【技术实现步骤摘要】
一种基于LSTM的借贷风险时效性预测系统及方法
本专利技术涉及计算机数据处理
,尤其涉及一种基于LSTM的借贷风险时效性预测系统及方法。
技术介绍
随着电子商务给大家带来足不出户的便利,手机支付也成为了主流的付款平台。与此同时,各大借贷平台和手机支付一起成为人们常用的付款方式,例如连同支付平台捆绑的借款组件,专门的app以及信用卡等。然而对于金融机构来说,在放款赚取利息的同时,也不可避免会发生用户不能在规定的时间内还清欠款,产生较高的循环利息而引发各种财务纠纷的事件,因此借款用户能否在规定时间内还清贷款,以及该给用户设定多少借款额度成为至关重要的问题。在借贷平台运营过程中,基于借款用户个人信息以及历史行为的已知数据,了解和分析用户借款还款的行为周期规律,在此基础上建立起有效的借贷用户画像模型,可以较好地建立用户进行贷款的仿真环境来模拟真实环境,从而为金融机构的借贷平台在运营过程中的信息组织和营销策略的制订提供重要的依据。关于借贷风险预测方法,已经有了很多的相关工作,但是,现有的方法都基于构造一个静态的用户画像模型,该模型需要基于静态的用户画像特征工程的方法进行构建,即:(1)该画像方法所对应的用户属性是固定的;(2)该平台对应的用户借款总额度是固定的;而真实情况很难做到用户的属性一成不变,或是用户的社交信息不发生变化,这样就大大降低了借贷风险的管控力度。由此引起的问题有:(1)用户的职业或是固定资产发生变化或是社交圈产生变化会对个人财务引起较大影响,无法及时反映由此类影响对用户造成还款行为的变化。(2)用户由于不确定因素提前还款、未及时还款或是不能全额还款,虽然现有的方法考虑进这方面因素,但也仅仅使用特征工程对其进行固定的分析,没有考虑时间因素,对借贷风险预测的准确性偏低。
技术实现思路
针对现有技术中的上述不足,本专利技术提供的一种基于LSTM的借贷风险时效性预测系统及方法,能够根据用户的个人信息、社交网络以及行为历史进行分析,对再次借款时可能发生风险的几率进行预测,从而提供给金融机构推荐此次借贷交易的结果,降低借贷风险。为了达到以上目的,本专利技术采用的技术方案为:本方案提供一种基于LSTM的借贷风险时效性预测系统,包括依次连接的服务器存储模块、长短记忆LSTM模块、强学习器GBDT训练模块、参数存储模块以及服务器选择模块;所述服务器存储模块,用于存储具有时效性的用户个人信息和历史数据;所述长短记忆LSTM模块,用于根据所述服务器存储模块中用户的历史数据,利用LSTM神经网络获取用户的周期性特征向量;所述强学习GBDT训练模块,用于将用户的个人信息和周期性特征向量组成样本,并根据所述样本利用GBDT算法计算得到强学习器的拟合函数;所述参数存储模块,用于存储所述长短记忆LSTM模块和强学习器GBDT训练模块的模型参数;所述服务器选择模块,用于利用所述强学习器GBDT训练模块得到的拟合函数预测用户的借贷风险。进一步地,所述长短记忆LSTM模块包括若干个长短记忆LSTM单元;每个所述长短记忆LSTM单元包括:遗忘门,用于控制是否遗忘上一层长短记忆LSTM单元的隐藏细胞状态;输入门,用于处理当前序列位置的输入;输出门,用于更新细胞状态,得到当前长短记忆LSTM单元的输出结果。基于上述系统,本专利技术还公开了一种基于LSTM的借贷风险时效性预测方法,包括以下步骤:S1、接收服务器发送的风险预测分析指令;S2、将具有时效性的用户个人信息和历史数据分别作为长短期记忆LSTM模块和强学习GBDT训练模块的输入,并初始化参数,并将初始化后的参数传输至上述两个模块中;S3、根据所述用户的历史数据,利用LSTM神经网络获取用户的周期性特征向量;S4、将所述用户的个人信息和周期性特征向量组成样本,并根据所述样本利用GBDT算法计算得到强学习器的拟合函数,并根据所述拟合函数预测用户的借贷风险;S5、存储所述长短记忆LSTM模块和强学习器GBDT训练模块的模型参数,并将所述借贷风险预测结果反馈至用户,完成对借贷风险的预测。进一步地,所述步骤S3包括以下步骤:S301、初始化长短期记忆LSTM模块中的参数;S302、根据所述用户的历史数据构建交叉熵损失函数;S303、判断迭代控制变量是否大于提取迭代上限T1,若是,则进入步骤S305,否则进入步骤S304;S304、根据判断所述交叉熵损失函数是否小于收敛判定阈值,若是,则进入步骤S305,否则,返回步骤S303,直至所述交叉熵损失函数值小于收敛判定阈值或大于迭代上限T1;S305、根据用户的历史数据,计算得到本轮长短记忆LSTM单元的权重矩阵,并根据所述权重矩阵计算得到用户的周期性特征向量。再进一步地,所述步骤S305包括以下步骤:S3051、根据用户的历史数据,利用遗忘门选择性遗忘前一个长短记忆LSTM单元的输出值,并将剩余的信息传入当前长短记忆LSTM单元,所述剩余信息ft的表达式如下:ft=σ(Wf·[ht-1,xt]+bf)=σg(Wfxt+Ufht-1+bf)其中,σ(·)为sigmoid函数,Wf和Uf分别为对应t时刻输入xt以及t-1时刻输出ht-1的权重矩阵,bf为偏置,xt为传入长短记忆LSTM模块的数据,ht-1为长短记忆LSTM单元的输出向量;S3052、根据当前长短记忆LSTM单元接收的信息,确定保存在细胞状态中的新信息;S3053、根据所述细胞状态中的新信息,计算得到长短记忆LSTM单元的输出值,并根据所述输出值获取用户的周期性特征向量。再进一步地,所述步骤S3053中长短记忆LSTM单元输出值ht的表达式为:ht=ot*tanh(Ct)ot=σ(Wo[ht-1,xt]+bo)=σ(Woxt+Uoht-1+bo)其中,ot为输出门的激活向量,σ(·)为sigmoid函数,bo、bC均为偏置,Ct为细胞状态向量,tanh(·)为正切函数,xt为传入长短记忆LSTM模块的数据,ht-1为长短记忆LSTM单元的输出向量,ft为遗忘门的激活向量,Ct-1为旧的细胞状态,it为输入门的激活向量,为输入门网络层创建的新的备选值向量,WC和Wo均为对应t时刻输入xt的权重矩阵,UC和Uo均为对应t-1时刻输出ht-1的权重矩阵。再进一步地,所述步骤S4包括以下步骤:S401、初始化强学习器GBDT训练模块中的参数,并构建目标损失函数;S402、判断迭代控制变量是否大于提取迭代上限T2,若是,则进入步骤S404,否则,进入步骤S403;S403、判断所述目标损失函数值是否小于收敛判定阈值,若是,则进入步骤S404,否则,返回步骤S402,继续迭代,直至目标损失函数值小于收敛判定阈值或大于迭代上限T2;S404、根据所述用户个人信息以及用户的周期性特征向量,利用强学习器本文档来自技高网
...

【技术保护点】
1.一种基于LSTM的借贷风险时效性预测系统,其特征在于,包括依次连接的服务器存储模块、长短记忆LSTM模块、强学习器GBDT训练模块、参数存储模块以及服务器选择模块;/n所述服务器存储模块,用于存储具有时效性的用户个人信息和历史数据;/n所述长短记忆LSTM模块,用于根据所述服务器存储模块中用户的历史数据,利用LSTM神经网络获取用户的周期性特征向量;/n所述强学习GBDT训练模块,用于将用户的个人信息和周期性特征向量组成样本,并根据所述样本利用GBDT算法计算得到强学习器的拟合函数;/n所述参数存储模块,用于存储所述长短记忆LSTM模块和强学习器GBDT训练模块的模型参数;/n所述服务器选择模块,用于利用所述强学习器GBDT训练模块得到的拟合函数预测用户的借贷风险。/n

【技术特征摘要】
1.一种基于LSTM的借贷风险时效性预测系统,其特征在于,包括依次连接的服务器存储模块、长短记忆LSTM模块、强学习器GBDT训练模块、参数存储模块以及服务器选择模块;
所述服务器存储模块,用于存储具有时效性的用户个人信息和历史数据;
所述长短记忆LSTM模块,用于根据所述服务器存储模块中用户的历史数据,利用LSTM神经网络获取用户的周期性特征向量;
所述强学习GBDT训练模块,用于将用户的个人信息和周期性特征向量组成样本,并根据所述样本利用GBDT算法计算得到强学习器的拟合函数;
所述参数存储模块,用于存储所述长短记忆LSTM模块和强学习器GBDT训练模块的模型参数;
所述服务器选择模块,用于利用所述强学习器GBDT训练模块得到的拟合函数预测用户的借贷风险。


2.根据权利要求1所述的基于LSTM的借贷风险时效性预测系统,其特征在于,所述长短记忆LSTM模块包括若干个长短记忆LSTM单元;每个所述长短记忆LSTM单元包括:
遗忘门,用于控制是否遗忘上一层长短记忆LSTM单元的隐藏细胞状态;
输入门,用于处理当前序列位置的输入;
输出门,用于更新细胞状态,得到当前长短记忆LSTM单元的输出结果。


3.一种基于LSTM的借贷风险时效性预测方法,其特征在于,包括以下步骤:
S1、接收服务器发送的风险预测分析指令;
S2、将具有时效性的用户个人信息和历史数据分别作为长短期记忆LSTM模块和强学习GBDT训练模块的输入,并初始化参数,并将初始化后的参数传输至上述两个模块中;
S3、根据所述用户的历史数据,利用LSTM神经网络获取用户的周期性特征向量;
S4、将所述用户的个人信息和周期性特征向量组成样本,并根据所述样本利用GBDT算法计算得到强学习器的拟合函数,并根据所述拟合函数预测用户的借贷风险;
S5、存储所述长短记忆LSTM模块和强学习器GBDT训练模块的模型参数,并将所述借贷风险预测结果反馈至用户,完成对借贷风险的预测。


4.根据权利要求3所述的基于LSTM的借贷风险时效性预测方法,其特征在于,所述步骤S3包括以下步骤:
S301、初始化长短期记忆LSTM模块中的参数;
S302、根据所述用户的历史数据构建交叉熵损失函数;
S303、判断迭代控制变量是否大于提取迭代上限T1,若是,则进入步骤S305,否则进入步骤S304;
S304、根据判断所述交叉熵损失函数值是否小于收敛判定阈值,若是,则进入步骤S305,否则,返回步骤S303,直至所述交叉熵损失函数值小于收敛判定阈值或大于迭代上限T1;
S305、根据用户的历史数据,计算得到本轮长短记忆LSTM单元的权重矩阵,并根据所述权重矩阵计算得到用户的周期性特征向量。


5.根据权利要求4所述的基于LSTM的借贷风险时效性预测方法,其特征在于,所述步骤S305包括以下步骤:
S3051、根据用户的历史数据,利用遗忘门选择性遗忘前一个长短记忆LSTM单元的输出值,并将剩余的信息传入当前长短记忆LSTM单元,所述剩余信息ft的表达式如下:
ft=σ(Wf·[ht-1,xt]+bf)=σg(Wfxt+Ufht-1+bf)
其中,σ(·)为sigmoid函数,Wf和Uf分别为对应t时刻输入xt以及t-1时刻输出ht-1的权重矩阵,bf为偏置,xt为传入长短记忆LSTM模块的数据,ht-1为长...

【专利技术属性】
技术研发人员:王庆先杨晗章淳刘鑫宇
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1