【技术实现步骤摘要】
一种基于PSO-BP神经网络的互联网金融信用评价方法
本专利技术属于互联网金融行业的风控
,具体提供一种利用粒子群算法(ParticleSwarmoptimization,PSO)优化BP神经网络的互联网金融信用评价方法。
技术介绍
随着银行、第三方支付、P2P、互联网借贷平台的发展,互联网金融对于个人信用评价的需求越来越高,除了使用基于逻辑回归、支持向量机、随机森林等各种算法的评分卡模型,基于神经网络的信用评价方法是一个很大
其中BP(BackPropagation)神经网络由于具备结构简单和适用性强等优点,使用最为广泛。BP神经网络又称误差反向传播神经网络,可利用误差反向调节神经网络的权值和阈值,具有很强的非线性映射能力,由于将信息全部存储于网络的连接权系数中,使网络具有一定的泛化能力和容错性。BP神经网络具有任意复杂的模式分类能力和优良的多维函数映射能力,特别适用于互金行业对于申请个人的信用评价。但传统的BP算法采用的是梯度下降法,不可避免地存在对初始权值敏感、收敛速度慢、学习率不稳定、易陷入局部 ...
【技术保护点】
1.本专利技术公开一种基于PSO-BP神经网络的互联网金融信用评价方法,其特征在于,包括以下步骤:/n步骤1:从互联网平台后端采集客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据,以及客户的贷后表现数据作为客户好坏标签和模型预测结果的真实值;/n步骤2:对采集的数据特征提取,进行标准化处理和主成分分析降维,按申请时间划分训练集和验证集;/n步骤3:首先根据训练集的特点初始化BP神经网络的输入节点数、输出节点数和隐藏层节点数,使用传统得梯度下降法和反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,构建BP神经网络模型;/n步骤4:建立粒子与BP神经网 ...
【技术特征摘要】
1.本发明公开一种基于PSO-BP神经网络的互联网金融信用评价方法,其特征在于,包括以下步骤:
步骤1:从互联网平台后端采集客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据,以及客户的贷后表现数据作为客户好坏标签和模型预测结果的真实值;
步骤2:对采集的数据特征提取,进行标准化处理和主成分分析降维,按申请时间划分训练集和验证集;
步骤3:首先根据训练集的特点初始化BP神经网络的输入节点数、输出节点数和隐藏层节点数,使用传统得梯度下降法和反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,构建BP神经网络模型;
步骤4:建立粒子与BP神经网络的连接权值和阈值的映射关系,以全局误差作为粒子的适应度函数,通过调整粒子速度和位置优化BP神经网络的连接权值和阈值,得到训练集PSO-BP神经网络模型;
步骤5:将验证集样本代入PSO-BP神经网络模型测试模型的准确率和稳定性,以验证集的均方误差作为适应度函数,再次利用PSO对验证集优化得到最优的PSO-BP神经网络预测模型;
步骤6:将验证集优化的PSO-BP神经网络预测模型部署至申请平台,对申请系统实时数据进行特征提取处理后输入训练后模型中得到申请评价结果,对疑似异常状态的申请发出系统预警,进行人工审批环节或拒绝申请。
2.根据权利要求1所述的一种基于PSO-BP神经网络的互联网金融信用评价方法,其特征在于,在步骤1中,从互联网金融平台后端根据贷后表现选取一定比例和数量正常还款和逾期客户作为建模样本,采集样本客户账户注册申请时的个人基本信息、监测软件中获取操作行为埋点数据。其中用户的个人申请信息包括:手机号、学历、婚姻状况、工作单位、住址、联系人信息,征信报告获取的个人基本信息、信用交易信息、公共信息、特别记录数据;所述埋点数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等。另外在合规要求下,不限于获取移动互联网行为数据、贷款APP内行为数据、信贷历史、运营商数据在内的全域多维度大数据。
3.根据权利要求1所述的一种基于PSO-BP神经网络的互联网金融信用评价方法,其特征在于,所述的步骤2中对采集的数据特征提取,进行标准化处理和主成分分析降维,标准化利用z-score归一化处理从而将各数据的量纲统一,主成分分析法可处理样本中的孤立点、噪音数据,消除特征间的自关联性,删除冗余指标达到降维效果,便于处理高维数据,方法如下:
步骤2-1:将采集的n个样本的特征数据构成空间特征数据集X={x1,x2,…,xi,…,xn}∈Rn×m,其中每个样本测得m个变量的数据,这n×m个数据构成一个空间特征数据集分析矩阵X如下:
可知xij(i=1,2,…,n;j=1,2,…,m)为第i条样本的第j个特征变量的取值。
步骤2-2:计算每个申请行为样本各个特征的均值和标准差:
步骤2-3:求解标准化矩阵:利用Z-score归一化得到标准化矩阵Z=(zij)n×m,计算公式如下:
步骤2-4:求解相关系数矩阵R=(rjk)m×m,计算公式如下:
步骤2-5:求解特征值及特征向量:由特征方程|λE-R|=0(其中E为单位向量)求出相关系数矩阵R的特征值由大到小排序λ1>λ2>…>λm以及对应特征向量为l1,l2,…,lm
步骤2-6:降维:按累计方差贡献率的原则,确定k,从而通过取前k个主成分,得到主成分矩阵(Fij)n×k,主成分降维后的矩阵计算公式如下:
由原始数据X(n×m)降维至主成分矩阵(Fij)n×k,即从原始m维降至k维,矩阵中的各个列向量Fv(v=1,2,…,k)即为所有申请样本的第v主成分值;
将主成分分析处理的数据集按照申请时间按照7:3比例进行划分为训练集数据和测试集。
4.根据权利要求1所述的一种基于PSO-BP神经网络的互联网金融信用评价方法,其特征在于,在步骤3中,首先根据训练集的特点初始化BP神经网络的输入节点数、输出节点数和隐藏层节点数,使用传统得最速下降法通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小,构建BP神经网络模型,具体步骤如下:
步骤3-1:神经网络的公式描述如下:
Tout=f(Tin1,Tin2,…,Tinn)
其中,Tout是神经网络需要预测的数据值,Tin1,Tin2,…,Tinn分别是神经网络输入层输入的n个数据值;
步骤3-2:隐藏层节点数p确定,为了避免复杂,本发明采用神经网络隐藏层数为1,隐藏层节点数p与输入层节点数n、输出层节点数q具有以下的函数关系:
其中,p为隐藏层节点数,n为输入层节点数(由实际的输入个数决定),q为输出层节点数(根据实际需求来决定),a为1~10之间的常数;
步骤3-3:隐藏层节点的输出为:
其中,Oj表示隐藏层的输出,j=1,2,…,p隐藏层节点,f(x)一般选用Sigmoid为激励函数xi表示隐藏层的输入,i=1,2,…,n是输入层节点,ωij表示隐藏层的权值,θj表示隐藏层的阈值;
步骤3-4:输出层节点的输出为:
其中,yk表示输出层的输出,Oj表示输出层的输入(即为隐藏层节点的输出),Tjk表示输出层的权值,θj表示输出层的阈值,i=1,2,…,n是输入节点,j=1,2,…,p是隐...
【专利技术属性】
技术研发人员:江远强,韩璐,李兰,
申请(专利权)人:百维金科上海信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。