当前位置: 首页 > 专利查询>同济大学专利>正文

基于BP_Adaboost模型的信用卡用户违约的预测方法及系统技术方案

技术编号:14945010 阅读:118 留言:0更新日期:2017-04-01 11:29
本发明专利技术提供一种基于BP_Adaboost模型的信用卡用户违约的预测方法及系统,包括获取信用卡用户的属性数据,并进行归一化处理,得到训练样本集和测试样本集;初始化训练样本的分布权值,确定BP神经网络结构,初始化BP神经网络的参数;利用训练样本,训练T个BP神经网络弱分类器;根据T个弱分类器得到强分类器,即用于信用卡用户违约预测的BP_Adaboost模型,以根据信用卡用户的属性数据预测是否会违约。本发明专利技术的基于BP_Adaboost模型的信用卡用户违约的预测方法及系统根据银行信用卡用户的历史信用信息进行数据分析、训练,建立BP_AdaBoost模型,提升了信用卡用户违约预测的准确度。

【技术实现步骤摘要】

本专利技术涉及一种预测方法及系统,特别是涉及一种基于BP_Adaboost模型的信用卡用户违约的预测方法及系统
技术介绍
随着金融业、银行业的发展,信用卡的使用也越来越广泛,给消费者的生活带来了很多便利。然而,信用卡的不安全因素也暴露无遗,例如,很多信用卡发行银行为了增加市场份额,超额发行现金和信用卡给不合格的申请者。同时,大多数的信用卡持有者不考虑其偿还能力,在消费上过度使用信用卡,积累了大量的信用卡债务,给发卡银行造成了巨大的损失。信用卡违约风险是由持卡人做出部分或全部支付的承诺时潜在的支付失败驱动的,它在持卡人在还款期限内出现资金紧张或不愿意偿还时发生。在一个健全的财务系统中,风险管理是在下游,而风险预测是在上游。风险预测的主要目的是利用企业绩效或者个人客户的信用风险,来降低风险和不确定性,因而具有很大的现实意义和价值。目前,对于违约风险,银行往往是利用传统的“评分系统”或者所谓“专家评分”来确定申请者风险水平。具体地,对信用卡持有人的信息数据进行评分,对不同的属性如年龄、职业、学历、收入及其在外部征信系统中的信用历史记录信息,根据其在违约预测方面的重要程度不同,予以不同的分值,以评分结果来预测持卡人在未来一定时期内用卡发生违约拖欠的概率。这种传统的评分方法,因为人的参与程度很大,所以具有很大的随意性和不稳定性。数据挖掘作为一种发现驱动型的知识发现技术,主要针对非常大型的数据进行研究和分析,采用自动或半自动的程序找出先前未知的、有趣的、可理解的隐含信息。利用数据挖掘方法,银行可以方便地部署一个预测模型,快速而有效地分析大量信用卡持有者的违约状况,已成为信用卡分析的重要工具。为了降低信用评价中的主观因素影响和反映信用的动态变化,判别分析、逻辑回归、分类树和神经网络法等方法逐渐被应用到信用评价领域,对信用卡用户的违约行为进行预测。判别分析(Discriminantanalysis,DA)又称分辨法,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。判别分析的基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标,据此即可预测某一客户样本属于“好”客户还是违约用户。逻辑回归(LogisticregressionLR)可以被看作是线性回归模型的一种特例。该方法能产生一个简单的分类概率公式,判断样本属于各个类别的概率,但其缺点在于不能很好的处理非线性问题以及解释变量之间的交互性影响。分类树方法(ClassificationTrees,CTs)是一种非参数统计方法,利用这种方法建立的信用卡违约预测模型并不是生成一个线性的评分表,其基本思想是按照某个特征变量的取值将客户总体分成两个子组,使得在不同组之间客户的违约概率差距尽量地大,而同一组内客户的违约概率尽量一致,然后再对这些子组进行而划分,达到一定的要求前,一直不断的重复这一过程,最后终止。整个过程可以用一个树状结构来表示,按照一定的规则,将每个根节点划分为“好”客户或“违约”客户。人工神经网络具备其他很多数据挖掘方法不具备的优势,因其非线性假设、泛化能力和映射能力等,在很多领域都得到了应用。其中BP(BackPropagation,反向传播)神经网络的应用最为广泛。BP网络是1986年由Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,它具有强大并行处理机制,高度自学习、自适应能力。而且BP神经网络算法非常的灵活,因为其内部的很多参数都是可以调节的。BP神经网络算法的主要设计思想是:首先输入信号通过隐藏层和输出层节点的处理计算,得到网络的实际输出,随后将其与期望得到的输出相比较,并计算实际输出与期望输出的误差;然后将误差作为修改权值的依据反向传播至输入层。这一过程中,计算输出层、隐藏层的权值、阈值增益,并更新权值、阈值,反复这一过程,直到实际输出与期望输出的误差达到预先设定的误差收敛标准或者达到最高迭代次数,从而获得最终的网络权值,构建信用卡违约预测模型,对样本进行预测。上述方法在信用卡违约预测方面,都能实现一定的准确率,但都忽略了信用卡数据的不均衡性,也就是违约客户的样本与诚实客户的样本数目相差太大的问题。Boosting是一种提高任意给定学习算法准确度的方法,其思想起源于Valiant提出的PAC(ProbablyApproximatelyCorrect)学习模型。1995年,Freund和Schapire改进了Boosting算法,提出了AdaBoost(AdaptiveBoosting)算法,Adaboost算法的核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。因此,Adaboost算法对不平衡数据集有着很好的鲁棒性,同时可以加强分类效果,进一步提高神经网络的泛化能力。该算法效率和Freund于1991年提出的Boosting算法几乎相同,但不需要任何关于弱学习器的先验知识,因而更容易应用到实际问题当中。使用Adaboost分类器可以排除一些不必要的训练数据特征,并将重点放在关键的训练数据上面。在产生单个的基分类器时可用相同的分类算法,也可用不同的分类算法。这些算法一般是不稳定的弱分类算法,如BP算法。因此,如何结合BP算法和Adaboosting算法来对信用卡用户进行违约预测成为一个极具前景的课题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于BP_Adaboost模型的信用卡用户违约的预测方法及系统,基于BP算法和Adaboosting算法,根据银行信用卡用户的历史信用信息进行数据分析、训练,建立BP_AdaBoost模型,从而实现对新的信用卡用户是否会违约的预测。为实现上述目的及其他相关目的,本专利技术提供一种基于BP_Adaboost模型的信用卡用户违约的预测方法,包括以下步骤:获取信用卡用户的属性数据,所述信用卡用户的属性为信用卡用户的信用评价指标;对信用卡用户的属性数据进行归一化处理,并将归一化后的每个用户的属性数据作为一个样本,将所有样本分为训练样本集和测试样本集;初始化训练样本的分布权值D1(i)=1/m,m为训练样本总数,i=1,2...m表示训练样本序号,根据训练样本输入、输出维数确定BP神经网络结构,初始化BP神经网络的权值、阈值、学习精度、最大迭代次数、学习率;第t次迭代时,利用m个训练样本训练BP神经网络弱分类器ft;根据BP神经网络弱分类器ft预测训练样本得到的预测序列gt,计算预测误差和其中i为gt(xi)≠yi时所对应的训练样本序号,xi为m个训练样本中第i个样本点;gt(xi)为BP神经网络弱分类器ft对样本点xi的预测分类结果;yi为BP神经网络弱分类器ft对样本点xi的期望分类结果;根据预测序列的预测误差和et计算预测序列的权重根据预测序列的权重at调整下一轮训练样本的分布权值为i=1,2...m,其中Bt是归一化因子;利用m个训练样本迭代训练BP神经网络弱分类器,迭代T次后得到T个BP神经网络弱分类器;T为自定义参数;根据T个弱分类器得到强分类器即用本文档来自技高网
...
基于BP_Adaboost模型的信用卡用户违约的预测方法及系统

【技术保护点】
一种基于BP_Adaboost模型的信用卡用户违约的预测方法,其特征在于:包括以下步骤:获取信用卡用户的属性数据,所述信用卡用户的属性为信用卡用户的信用评价指标;对信用卡用户的属性数据进行归一化处理,并将归一化后的每个用户的属性数据作为一个样本,将所有样本分为训练样本集和测试样本集;初始化训练样本的分布权值D1(i)=1/m,m为训练样本总数,i=1,2...m表示训练样本序号,根据训练样本输入、输出维数确定BP神经网络结构,初始化BP神经网络的权值、阈值、学习精度、最大迭代次数、学习率;第t次迭代时,利用m个训练样本训练BP神经网络弱分类器ft;根据BP神经网络弱分类器ft预测训练样本得到的预测序列gt,计算预测误差和其中i为gt(xi)≠yi时所对应的训练样本序号,xi为m个训练样本中第i个样本点;gt(xi)为BP神经网络弱分类器ft对样本点xi的预测分类结果;yi为BP神经网络弱分类器ft对样本点xi的期望分类结果;根据预测序列的预测误差和et计算预测序列的权重根据预测序列的权重at调整下一轮训练样本的分布权值为i=1,2...m,其中Bt是归一化因子;利用m个训练样本迭代训练BP神经网络弱分类器,迭代T次后得到T个BP神经网络弱分类器;T为自定义参数;根据T个弱分类器得到强分类器即用于信用卡用户违约预测的BP_Adaboost模型,以根据信用卡用户的属性数据预测是否会违约。...

【技术特征摘要】
1.一种基于BP_Adaboost模型的信用卡用户违约的预测方法,其特征在于:包括以下步骤:获取信用卡用户的属性数据,所述信用卡用户的属性为信用卡用户的信用评价指标;对信用卡用户的属性数据进行归一化处理,并将归一化后的每个用户的属性数据作为一个样本,将所有样本分为训练样本集和测试样本集;初始化训练样本的分布权值D1(i)=1/m,m为训练样本总数,i=1,2...m表示训练样本序号,根据训练样本输入、输出维数确定BP神经网络结构,初始化BP神经网络的权值、阈值、学习精度、最大迭代次数、学习率;第t次迭代时,利用m个训练样本训练BP神经网络弱分类器ft;根据BP神经网络弱分类器ft预测训练样本得到的预测序列gt,计算预测误差和其中i为gt(xi)≠yi时所对应的训练样本序号,xi为m个训练样本中第i个样本点;gt(xi)为BP神经网络弱分类器ft对样本点xi的预测分类结果;yi为BP神经网络弱分类器ft对...

【专利技术属性】
技术研发人员:蒋昌俊闫春钢丁志军张亚英许朴
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1