一种新型个人信用评估方法及系统技术方案

技术编号:32203879 阅读:26 留言:0更新日期:2022-02-09 17:08
本发明专利技术具体涉及一种新型个人信用评估方法及系统,主要包括数据采集、数据清洗、模型训练等主要环节,分别从数据量、特征值两方面对采集数据进行了处理,并集成SVM、GWO

【技术实现步骤摘要】
一种新型个人信用评估方法及系统


[0001]本专利技术属于信用评估
,具体涉及一种新型个人信用评估方法及系统。

技术介绍

[0002]在当今的大数据时代,互联网技术和人工智能技术快速发展,人们的生活消费观在不断地发生着改变,从过去的存钱消费转变到现在的信用消费。网络个人贷款服务不断增长,使得个人信贷成为商业银行等金融服务机构必不可少的盈利点,因此各个商业银行等金融服务机构在对个人进行信贷发放的时候必须提前对个人的信用状况进行评估,以此来降低因个人信贷风险给商业银行等金融服务机构带来的威胁,确保其在个人信贷业务中的收益。
[0003]个人信用体系就是一套详细记录消费者信用活动的体系,这是在社会范围内构建发达的信用消费经济的基础。个人信用体系作为社会信用体系的基础,其作用越来越重要。
[0004]信用评估本质上是模式识别中的一类分类问题,即将企业或个体消费者按信用情况划分类别。具体做法是根据历史上每个类别的若干样本,找出每个信用类别的特点,从而总结出分类的规则,建立数学模型,以此来预测借款人的信用类别,为银行及其他金融机构提供信用评估的依据。
[0005]随着市场竞争愈来愈激烈以及计算机技术的迅速发展,越来越多的方法(如统计学及运筹学等定量分析工具)被应用到信用评估领域。统计学方法主要包括线性回归、判别分析和逻辑回归等,运筹学方法则主要指的是一些线性规划的方法。大部分的信用评分模型都是使用其中的一种方法或者将几种方法结合起来使用。近些年,一些非参数的统计方法以及人工智能模型也被引入到评分模型中,如神经网络、专家系统、基因算法以及非参数统计中的最近邻方法等。
[0006]最近,深度学习成为一个火热的研究课题,其显著优点是能够自动提取数据特征,深度学习可以被理解为具有多个非线性层的深度神经网络,能够让计算机自动学习出模式特征并将特征学习融入到建立模型的过程中,从而减少人为设计特征造成的模型的不完备性。而目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。

技术实现思路

[0007]为进一步提高信用评估的准确性,本专利技术提供一种新型个人信用评估方法及系统,采用以下技术方案:
[0008]一种新型个人信用评估方法,包括以下步骤:
[0009]步骤1:采集已确定信用类型的贷款客户的多种类型的信用数据;
[0010]步骤2:对采集到的信用数据进行预处理,以去除异常数据、删除重复数据、消除信用数据间的共线性,并确定参与信用评估的信用数据类型;
[0011]步骤3:通过基于树的机器学习算法和主成分分析法提取参与信用评估的信用数
据的特征变量;
[0012]步骤4:利用特征变量及其对应的贷款客户的信用类型构建训练样本集,并通过训练样本集分别训练SVM、GWO

Sigmoid、GA

BP分类模型;
[0013]步骤5:采集待评估客户的信用数据,获取其参与信用评估的的信用数据并通过步骤3所述的基于树的机器学习算法和主成分分析法提取特征变量;
[0014]步骤6:将步骤5中提取的特征变量分别输入到训练完成的SVM、GWO

Sigmoid、GA

BP分类模型中,获取对应的分类结果,每种模型的分类结果为待评估客户属于每种信用类型的概率;
[0015]步骤7:将三种分类模型分类结果中相应信用类型的概率加权求和,权值由各分类模型的Kappa系数确定,求和后概率最大的信用类型作为待评估客户的最终信用类型。
[0016]进一步地,所述信用类型包括信用度极高客户、信用度良好客户、信用度一般客户、信用度较差客户和信用度极差客户。
[0017]进一步地,步骤1中,为保证数据的均衡性,获取同信用类型贷款客户的同种信用数据的值域,在值域内随机选取一个值作为该类信用数据以增广该信用类型的数据量。
[0018]进一步地,步骤2中,若某信用类型贷款客户的某种信用数据缺失,则用同信用类型贷款客户的同种信用数据的均值填充;消除信用数据间的共线性时,分别计算各信用数据间的相关系数,若某两种信用数据的相关系数大于一定阈值则将该两种信用数据的均值作为参与信用评估的信用数据,否则将该两种信用数据保留并参与信用评估。
[0019]进一步地,所述相关系数的计算公式为
[0020][0021]式中,r表示两种信用数据的相关系数,与分别表示两种信用数据的均值,x
i
与y
i
分别表示第i个贷款客户的两种信用数据,n为获取到信用数据的贷款客户的总数;所述相关性阈值为0.85。
[0022]基于所述信用评估方法的信用评估系统,包括数据采集模块、数据预处理模块和分类模块;所述数据采集模块用于采集待评估客户的各种信用数据;所述数据预处理模块根据采集到的各种信用数据获取参与信用评估的信用数据;所述分类模块包括算法执行单元和训练完成的SVM、GWO

Sigmoid、GA

BP分类模型,算法执行单元用于执行步骤3中基于树的机器学习算法和主成分分析法,以提取参与信用评估的信用数据的特征变量,并将特征变量分别输入到训练完成的SVM、GWO

Sigmoid、GA

BP分类模型中获取对应的分类结果,最后通过加权求和的方式获取并输出待评估客户的最终信用类型。
[0023]相比于现有技术,本专利技术在数据采集阶段通过数据增广来确保各信用类型样本数据的均衡性,并借助相关系数消除各信用数据间的共线性以确定参与信用评估的信用数据类型,为分类模型的训练提供了良好的数据基础。此外,本专利技术利用集成学习的思想综合三种分类模型的分类结果从而获取最终的信用评估结果,避免了单一模型的泛化性问题,进一步提高了信用评估的准确性。
附图说明
[0024]图1为本专利技术方法的流程图;
[0025]图2为SVM分类模型的示意图;
[0026]图3为GWO

Sigmoid分类模型的示意图;
[0027]图4为GA

BP分类模型的示意图。
具体实施方式
[0028]现在结合附图对本专利技术作进一步详细的说明。
[0029]如图1所示,本专利技术信用评估方法主要包括以下步骤:
[0030](1)采集已确定信用类型的贷款客户的多种类型的信用数据,本专利技术中将贷款客户分为信用度极高客户、信用度良好客户、信用度一般客户、信用度较差客户和信用度极差客户五种,贷款客户的信用数据包括年龄、历史借贷金额、历史信用等级等多种类型的数据。
[0031](2)对采集数据进行数据增广和数据清洗以确定参与信用评估的信用数据类型。
[0032]实际上,信用度低的贷款客户要远少于信用度高的贷款客户,在采集数据时,信用度越低的客户其样本数量越少,而分类模型的训练对于各类样本的数量是有一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种新型个人信用评估方法,其特征在于,包括以下步骤:步骤1:采集已确定信用类型的贷款客户的多种类型的信用数据;步骤2:对采集到的信用数据进行预处理,以去除异常数据、删除重复数据、消除信用数据间的共线性,并确定参与信用评估的信用数据类型;步骤3:通过基于树的机器学习算法和主成分分析法提取参与信用评估的信用数据的特征变量;步骤4:利用特征变量及其对应的贷款客户的信用类型构建训练样本集,并通过训练样本集分别训练SVM、GWO

Sigmoid、GA

BP分类模型;步骤5:采集待评估客户的信用数据,获取其参与信用评估的的信用数据并通过步骤3所述的基于树的机器学习算法和主成分分析法提取特征变量;步骤6:将步骤5中提取的特征变量分别输入到训练完成的SVM、GWO

Sigmoid、GA

BP分类模型中,获取对应的分类结果,每种模型的分类结果为待评估客户属于每种信用类型的概率;步骤7:将三种分类模型分类结果中相应信用类型的概率加权求和,权值由各分类模型的Kappa系数确定,求和后概率最大的信用类型作为待评估客户的最终信用类型。2.如权利要求1所述的一种新型个人信用评估方法,其特征在于,所述信用类型包括信用度极高客户、信用度良好客户、信用度一般客户、信用度较差客户和信用度极差客户。3.如权利要求1所述的一种新型个人信用评估方法,其特征在于,步骤1中,为保证数据的均衡性,获取同信用类型贷款客户的同种信用数据的值域,在值域内随机选取一个值作为该类信用数据以增广该信用类型的数据量。4.如权利要求1所述...

【专利技术属性】
技术研发人员:刘鹏张真高中强张堃夏春蒙
申请(专利权)人:南京云创大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1