一种基于AFSA-ELM的信用评估方法技术

技术编号:27309056 阅读:25 留言:0更新日期:2021-02-10 09:28
本发明专利技术公开了一种基于AFSA

【技术实现步骤摘要】
一种基于AFSA-ELM的信用评估方法


[0001]本专利技术属于互联网金融行业的风控
,具体涉及一种基于AFSA-ELM的信用评估方法。

技术介绍

[0002]近年来在互联网金融信用评估方面,人工神经网络已经被证明是表现不错的研究模型。目前在信用评估应用中大多采用的是BP神经网络、RBF神经网络和Elman回归神经网络,或者基于这三种网络的一些改进。然而,这三种神经网络在处理数据进行预测时存在各种不足:BP神经网络是基于梯度下降算法的,存在局部极小、鲁棒性不高等缺陷;RBF神经网络属于静态前馈网络,对处理动态时间建模问题存在不足;Elman神经网络是一种局部的循环网络,存在隐含神经元多、收敛速度慢、训练时间长等缺点。
[0003]极限学习机(Extreme Learning Machine,ELM)是一种新型单隐层前馈神经网络,相比于采用其他的神经网络,不需要基于梯度的学习算法一样通过迭代反复调整更新网络的输入层与隐层间的连接权值及隐层节点的阈值,训练前只需要设置合适的隐层节点数,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值完成整个网络的训练。ELM以其设置参数少、泛化能力强、训练速度快等优点成为研究的热点,非常适用于金融行业的信用评估。
[0004]但是传统ELM随机产生输入层到隐层连接权值和隐层阈值的初始值,容易陷入局部最小值,不易获得最优ELM模型进行预测,现有技术使用遗传算法、粒子群算法、蚁群算法等群集智能优化算法来优化ELM初始连接权值和隐层阈值,但遗传算法对初始种群的选择有一定的依赖性,粒子群算法对最大速度选取和加权因子的设定较困难,蚁群算法对参数选取和设定较困难,且都存在容易陷入局部最优、收敛速度慢等缺点,现有技术存在着各种各样的问题。
[0005]如授权公告号为CN111160752A所公开的信用评估方法,其虽然实现了操作方便、省力,且数据实时性好,但是并未解决现有检测方式过于单一,未经过多种计算得出不准确的结论,容易陷入死循环瘫痪,精准度不高的问题,为此我们提出一种基于AFSA-ELM的信用评估方法。

技术实现思路

[0006]本专利技术的目的在于提供一种基于AFSA-ELM的信用评估方法,以解决上述
技术介绍
中提出的问题。
[0007]为实现上述目的,本专利技术提供如下技术方案:一种基于AFSA-ELM的信用评估方法,包括有以下步骤:
[0008]S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;
[0009]S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;
[0010]S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;
[0011]S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;
[0012]S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;
[0013]S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。
[0014]优选的,所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。
[0015]优选的,所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
[0016]优选的,所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,Min-Max标准化的公式如下:
[0017][0018]其中x'是归一化后的值,x
min
是特征中的最小值,x
max
是特征中的最大值,x为特征的初始值,再对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。
[0019]优选的,所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,可以随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。
[0020]优选的,所述ELM的训练可分为以下几个步骤:
[0021]S31:确定神经网络模型的输入层、输出层及隐层的结构,
[0022]给定N个不同样本的集合N={(x
i
,y
i
)|i=1,2,

,N;x
i
∈R
n
;y
i
∈R
m
},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:
[0023][0024]其中m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;
[0025]S32、给定训练集T={(x1,y1),

,(x
j
,y
j
),

,(x
n
,y
n
)},其中,x
j
∈R
n
,y
j
∈R,j=1,

,N,x
j
是一个n维向量;包括n个隐层节点的输出矩阵的计算公式为:
[0026]H=g(WX
T
+b)
[0027]其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:
[0028][0029]S33:求解隐层到输出层的连接权重
[0030]神经网络的输出值为:
[0031]P=(H
T
β)
[0032]其中,β是隐层到输出层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于AFSA-ELM的信用评估方法,其特征在于:包括有以下步骤:S1:根据互联网金融平台所获取客户的信息选择影响信用评分的参数,构建建模样本集;S2:对建模样本集进行归一化处理后切分训练集和测试集,切分训练集和测试集;S3:根据训练集构建ELM模型,初始化神经网络参数,包括各层的节点个数、连接权值和阈值;S4:在训练集上利用AFSA算法对ELM的隐层权值和阈值进行优化,将最优个体给ELM模型赋值,完成模型的建立;S5:采用优化后的ELM模型对测试集进行预测后验证模型的准确率,以均方根误差为指标,与遗传算法、粒子群算法优化的ELM模型的进行对比;S6:将AFSA-ELM的信用评分模型部署至申请平台输出实时申请信用评分,实现申请客户的实时审批,并定期将有表现数据输入到模型训练,实现模型的在线更新。2.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S1中从互联网金融平台后端根据贷后表现选取相同数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。3.根据权利要求2所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述个人基本信息包括有手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括有埋点时采集的设备行为数据和日志数据,其中设备行为数据包括有登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,所述日志数据包括有7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计;并且合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。4.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S2中利用最大最小法将特征值中选出的有用的字段进行归一化处理,把所有数据都转化为[0,1]之间的数值,取消各维数据间的数量级差别,采用离差(Min-Max)标准化法来对数值归一化处理将其映射到[0,1]区间,Min-Max标准化的公式如下:其中,x'是归一化后的值,x
min
是特征中的最小值,x
max
是特征中的最大值,x为特征的初始值。对归一化后的数据集根据申请时间按照7:3比例切分为训练集和测试集。5.根据权利要求1所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述S3中在根据所述根据训练集构建ELM模型,初始化神经网络参数,所述ELM是一种单隐层前向神经网络,通过利用Moore-Penrose广义逆求解网络权重,随机产生输入层与隐层间的连接权值及隐层节点的阈值,在训练过程中无需调整,只需要设置隐层节点的个数,便可以获得唯一的最优解,ELM具有网络结构简单,学习速度快,泛化性能好等优点。6.根据权利要求5所述的一种基于AFSA-ELM的信用评估方法,其特征在于:所述ELM的
训练可分为以下几个步骤:S31:确定神经网络模型的输入层、输出层及隐层的结构,给定N个不同样本的集合N={(x
i
,y
i
)|i=1,2,

,N;x
i
∈R
n
;y
i
∈R
m
},根据研究,隐层节点个数n和输入、输出节点个数存在以下关系:其中,m、l分别为ELM输入、输出节点的个数,a为常数,通常取1~10;S32、给定训练集T={(x1,y1),

,(x
j
,y
j
),

,(x
n
,y
n
)},其中,x
j
∈R
n
,y
j
∈R,j=1,

,N,x
j
是一个n维向量;具有n个隐层节点的输出矩阵H的表达式为:H=g(WX
T
+b)其中,输入层与所述隐层由权值W连接,隐层与输出层由权值β连接,b为隐层节点的阈值,W、β、b表达式如下:S33:求解隐层到输出层的连接权重神经网络的输出值为:P=(H
T
β)其中,β是隐层到输出层的权值矩阵,H是隐层节点的输出矩阵,对于给定的训练输出样本Y=(y1,y2,

,y
n
),用输出样本替代网络输出值,则权值矩阵β求解公式如下:其解为:其中,(H
T
)
+
表示转置矩阵HT的Moore-Penrose广义逆;则具有n个隐层节点的ELM输出...

【专利技术属性】
技术研发人员:江远强李兰韩璐
申请(专利权)人:百维金科上海信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1