【技术实现步骤摘要】
基于细菌觅食算法优化灰色神经网络的违约概率预测方法
本专利技术涉及互联网金融行业的风控
,具体为基于细菌觅食算法优化灰色神经网络的违约概率预测方法。
技术介绍
随着互联网金融的发展,消费信贷业务不断扩展,对贷款申请人的违约概率预测的重要性日益加强。违约概率分析是对信贷申请者的准确信用评估可帮助信贷平台有效规避违约概率。近年来,逻辑回归、贝叶斯网络、支持向量机和决策树等机器学习算法都被应用于个人违约概率分析,但这些传统的算法预测精度有限。贝叶斯网络等方法多依赖于专家经验,带有主观性;SVM算法借助二次规划,适用于小样本、高维模式识别,在大规模样本中难以实施;BP神经网络具有较强的非线性拟合能力,但其精度依赖于大规模样本,因此,对基于细菌觅食算法优化灰色神经网络的违约概率预测方法的需求日益增长。灰色神经网络(GreyNeuralNetwork,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将将灰色模型微分方程的解映射到BP神经网络,然后通过神经网络的训练得到微分方程的系数,进而使用该微分方程进行 ...
【技术保护点】
1.一种基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,包括以下六个步骤:/nS1、采集一定比例数量的正常和逾期还款客户作为建模样本,并采集建模样本的客户账户注册个人基本信息、监测软件中获取操作行为埋点数据作为信用数据,还款表现做标签化处理;/nS2、数据预处理,对信用数据进行信息提取、预处理和归一化,去除不规则数据和填补缺失数据,将数据组按照7:3比例随机划分为训练集和测试集;/nS3、根据建模样本的数据特征,构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;/nS4、构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食 ...
【技术特征摘要】
1.一种基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,包括以下六个步骤:
S1、采集一定比例数量的正常和逾期还款客户作为建模样本,并采集建模样本的客户账户注册个人基本信息、监测软件中获取操作行为埋点数据作为信用数据,还款表现做标签化处理;
S2、数据预处理,对信用数据进行信息提取、预处理和归一化,去除不规则数据和填补缺失数据,将数据组按照7:3比例随机划分为训练集和测试集;
S3、根据建模样本的数据特征,构建灰色神经网络拓扑结构,确定网络的参数,初始化灰色神经网络的权值和偏置;
S4、构建灰色神经网络的权值偏置与细菌觅食算法的映射关系,通过细菌觅食算法得到最优权值和偏置赋给灰色神经网络,使用训练集对灰色神经网络进行训练;
S5、将测试集输入训练好的灰色神经网络模型进行测试,验证模型的准确性,并以模型精度评价指标与遗传算法、粒子群算法优化的模型进行对比与评价;
S6、将灰色神经网络模型部署至申请平台,获取实时申请客户的数据并将作为待测样本导入预测模型中输出违约概率预测结果,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
2.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
3.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S2中,首先,结合常识和统计学规律对于原始数据进行预处理,剔除错误数据;其次,由于神经网络复杂,网络对于输入数据比较敏感以及输入数据有着不同的单位和取值范围,各神经网络的激活函数、学习规则不同,在进行灰色神经网络模型预测前,需先对数据进行归一化处理,计算公式如下:
其中,xmax为样本数据中的最大值;xmin为样本数据中的最小值;归一化后结果的取值范围为[-1,1]。
4.根据权利要求1所述的基于细菌觅食算法优化灰色神经网络的违约概率预测方法,其特征在于,在S3中,灰色神经网络(GreyNeuralNetwork,GNN)是一种融合灰色模型和BP神经网络的混合模型,思路是将色模型微分方程的解映射到BP神经网络,当网络收敛时,从训练好的网络中提取出相应的连接权值系数,计算相应的系数a和bi(i=1,2,…,n-1)从而得到一个白化的微分方程,进而利用此微分方程对系统进行数据预测。具体步骤如下:
S31、确定灰色神经网络的拓扑结构,初始化灰色神经网络的权值和偏置
根据选定的训练样本,构建灰色神经网络模型,初始灰色神经网络结构,确定输入维数、隐含层层数与神经元个数、输出维数,以此算出需要优化的权值和偏置的数目,确定输入层到隐含层的激活函数,输出层传递函数。
本专利将灰色模型的输出序列作为神经网络的输入序列,即串联方式。设原始数据序列为:
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
X(0)经过累加生成后得到新的数据序列X(1),此时X(1)呈指数增长,数据序列的分布规律经变换后变强,可通过微分方程、函数预测或进行数据拟合。
S32、建立灰色神经网络模型的微分方程
若记X(0)为x(t),X(1)为y(t),其预测结果用z(t)表示,将累加生成的数列建立微分方程,得到n个参数对应的灰色神经网络模型的微分方程:
其中,y1为输出参数;y2,y3,…,yn为输入参数;a,b1,…,bn-1为微分方程的系数,可根据训练样本对微分方程的系数a,b1,b2,…,bn-1进行初始化赋值。
预测结果用z(t)表示为:
令:
其中,y2(t),…,yn(t)为输入到网络中建立模型关于时间的一系列变化参数;
则预测结果可由上式推出:
S33、微分方程映射到BP神经网络
将上式映射到一个BP神经网络中,就得到一个具有n个输入,1个输出的灰色神经网络,所述的灰色神经网络分为4层:LA、LB、LC、LD分别为输入层、隐含层1、隐含层2、输出层。
令根据微分方程的初始化系数a,b1,…,bn-1计算μ1,μ2,…,μn-1。
则神经网络的各初始权值可表示为:
ω11=a;
ω21=-y1(0);ω22=u1;ω23=u2;…;ω2n=un-1;
ω31=ω32=…=ω3n=1+e-at
其中,ω11表示LA层到LB层的连接权值;ω21,ω22,ω23,…,ω2n表示LB层到LC层的连接权值;ω31,ω32,…,ω3n表示LC层到LD层的连接权值;y1为最终预测值。
根据a、μ1,μ2,…,μn-1可计算得到网络的连接权值ω22,ω23,…,ω2n、ω31,ω32,…,ω3n。
S34、网络输出
对每一输入序列(t,y(t)),t=1,2,3,…,n,计算每层输出:
LA输出:a=ω11t
LB输出:
LC输出:c1=bω21,c2=y2(t)bω22,c3=y3(t)bω23,…,cn=yn(t)bω2n
LD输出,即网络输出:
其中,θ表示LD层输出节点的偏置,表示为:
θ=(1+e-at)(d-y1(0))
S35、调整权值和偏置
计算网络预测输出与期望输出的误差:
LD层误差:δ=(d-y1(t))2
LC层误差:
LB层误差:
然后,根据误差调整权值和偏置:
调整LB到LC的权值:
w21=-y1(0),w22=w22-μ1δ2b,…,w2n=w2n-μn-1δnb
其中,μi表示第二层与第三层的第i+1个节点之间权值调节系数;
调整LA到LB的连接权值:
w11=w11-atδn+1
调整LD层输出节点的偏置θ:
S36、判断LD层误差δ是否大于预设的期望误差值,若大于,则返回S32,继续训练,否则训练结束。将待检测数据输入到已经训练好的灰色神...
【专利技术属性】
技术研发人员:江远强,
申请(专利权)人:百维金科上海信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。