基于逻辑回归的银行对公贷款违约判别方法技术

技术编号:29758085 阅读:14 留言:0更新日期:2021-08-20 21:11
本发明专利技术提供了基于逻辑回归的银行对公贷款违约判别方法,属于计算机技术领域。本发明专利技术采用灰色关联法计算各行业的违约倾向系数;采用单因素分析提取对被解释变量影响最大的几个解释变量,将从单因素分析中提取出来的原始变量,取方差累积贡献率L达到预设阈值的前m个指标为违约预测指标,每指标都是各原始变量的线性组合,各指标之间互不相关,通过二项逻辑回归算法建立二项逻辑回归模型进行违约概率预测,实现了对存在潜在违约风险的金融客户提前预警识别。

【技术实现步骤摘要】
基于逻辑回归的银行对公贷款违约判别方法
本专利技术涉及计算机
,尤其涉及一种基于逻辑回归的银行对公贷款违约判别方法。
技术介绍
随着近年来金融经济的高速发展,贷款成为企业筹资的一大重要支撑手段,不可避免的企业违约现象的发生与之而来,而且越来越频繁的发生。银行业务结构和经营环境的变化以及金融创新的迅速发展,促使越来越多的银行意识到需要构建更加全面和系统的信用风险管理系统来应对金融风险日趋复杂化的现实,所以贷款企业违约风险测度具有极大的现实意义。目前国外学术界和金融界对违约概率的测度与评估的研究概括起来有:(1)巴塞尔委员会新资本协议与国际知名金融机构推出的高级信用风险模型,主要针对企业违约概率数值如何测算问题的研究,这些模型也是巴塞尔委员会推荐的在资本金及经济资本方面计算的依据。(2)学术界对违约率的评估研究,集中于影响违约率的关键变量探寻,并利用企业历史样本建立企业违约率分类判别模型来估计企业违约的可能性。这两个方法相互补充,相互促进,但也存在过于依靠人工经验等弊端。在中国专利申请文献CN111192140A中,公开了一种客户违约概率预测的方法,根据待识别客户标识从预先保存的数据集中选取对应的指标数据;指标数据包括以下至少之一:企业基本信息、企业信贷数据、企业财务数据、企业工商数据、企业社保数据;将指标数据作为预先训练的违约概率预测模型的输入,预测待识别客户的违约概率。该方法还包括:利用模型训练算法对样本数据进行模型训练得到违约概率预测模型,包括对样本训练集中的样本数据进行预处理;利用特征相关性分析方法对预处理后的样本数据进行违约变量的相关性分析得到特征候选集;利用模型训练算法对特征候选集进行模型训练得到违约概率预测模型。根据违约业务定义对样本数据构造违约特征;利用特征相关性分析方法分析各个违约特征与违约变量的相关性程度,选择相关性高的违约特征;将选择的违约特征作为特征候选集。利用Xgboost算法对特征候选集进行模型训练得到违约概率预测模型。在得到违约概率预测模型之后,根据所述违约概率预测模型对预先准备好的样本测试集中的样本数据进行违约概率预测;利用ROC曲线、AUC或KS值对违约概率预测模型进行评估。该方法在预测违约概率时,没有考虑行业平均违约率,也未对行业平均违约率进行分布和结构的分析,特征分析选择与违约变量相关性高的违约特征进行分析,使得预测准确率、实时性、有效程度等无法满足实际工作需要。现有技术至少存在以下不足:1.对公贷款违约存在样本量小、考虑周期短和较少考虑地区因素等缺陷,使得违约概率预测不准,算法的不精确导致业务人员工作效率降低。2.所使用的算法单一,无法满足业务部门实时、动态进行风险排查的需求。3.模型与算法阈值的设定不合理,频繁预警导致风险排查频率过高,加重了金融行业客户在还款期间带来应对排查的负担。
技术实现思路
为解决现有技术中存在的问题,本专利技术提供了一种基于逻辑回归的银行对公贷款违约判别方法,采用灰色关联法计算各行业的违约倾向系数;采用单因素分析提取对被解释变量影响最大的几个解释变量,将从单因素分析中提取出来的原始变量,取方差累积贡献率L达到预设阈值的前m个指标为违约预测指标,每指标都是各原始变量的线性组合,各指标之间互不相关,并通过财务指标、工商登记信息指标、行业贷款计划指标等信息根据二项逻辑回归算法建立二项逻辑回归模型进行违约概率预测,实现了对金融客户还款期间所蕴含的经营风险、还款能力进行实时、动态分析和预警。本专利技术提供了一种基于逻辑回归的银行对公贷款违约判别方法,包括如下步骤:违约预测指标预提取步骤,采用单因素方差分析法或多重共线性验证方法,根据数据库中的企业基本信息和企业财务指标,提取对违约率影响最大的N个指标;所述企业基本信息包括:企业名称、数据年度、是否违约、成立日期、在职员工数、总资产和借款人组织机构代码;是否违约、成立日期和在职员工数参与到指标变量矩阵中;所述企业财务指标:主营业务收入、流动比率、速动比率、现金比率、资产负债率、负债权益比率、利息保障倍数、存货周转率、应收账款周转率、营业周期、流动资产周转率、总资产周转率、固定资产周转率、总资产报酬率、成本费用利润率、销售净利率、净资产收益率、销售毛利率、盈余现金保障倍数、现金流动负债比、营业总成本、现金流动负债比、管理费用、销售费用、财务费用、无形资产、长期借款、短期借款、净利润和营业收入;违约预测指标确定步骤,根据预提取的N个指标,取方差累积贡献率达到预设阈值的指标作为违约预测的指标;二项逻辑回归模型建立步骤,将违约与否作为二项逻辑回归中的被解释变量,建立二项逻辑回归模型;违约判断步骤,根据二项逻辑回归模型及企业数据,得到违约概率;根据违约概率和预设的违约概率阈值,判断该企业是否违约。优选地,采用单因素方差分析法提取对违约率影响最大的N个指标具体包括如下步骤:每个指标单独与违约与否进行单因素方差分析,取设定年份内的数据,根据如下公式得到检验统计量F的值:其中,k为设定年份数;n为数据库中该企业同行业内所有公司的数量;为第i年数据库中该企业同行业内各公司对应该指标变量的均值;为设定年份内数据库中该企业同行业内各公司对应该指标变量的总均值;ni为第i年的样本量;xij第i年数据库中该企业同行业内第j个公司对应该指标变量的取值;根据得到的检验统计量F的数值,查询F分布表,得到检验p值;选择N个p值最小的指标,作为对违约率影响最大的N个指标。优选地,通过多重共线性验证方法提取对违约率影响最大的N个指标具体包括如下步骤:对各待检验指标进行多重共线性检验,检验公式为:c1X1+c2X2+…ciXi…+cnXn=c0,若存在c0,c1,c2,…,cn使得该公式成立,则待检验指标存在多重共线性;其中,Xi为第i个待检验指标;ci为第i个待检验指标的系数;c0为预设常数;计算各待检验指标的拟合优度:其中,Rj为第j个待检验指标的拟合优度;Yj为第j个待检验指标的真实值;为第j个待检验指标以其余指标为解释变量进行回归时得到的回归模型估计量;为待检验指标真实值的均值;对各待检验指标的拟合优度进行F检验:其中,为第j.个解释变量对其他解释变量的回归方程的判定系数;k为解释变量的个数;n为样本量;j为解释变量的序号;j.个用于F检验的解释变量的序号;Fj为第j个待检验指标经过F检验后的拟合优度;F(k-1,n-k)是指自由度从k-1到n-k的F分布;根据对各指标的拟合优度进行F检验得到的检验结果,查询F分布表,得到检验p值;选择N个p值最大的指标,作为对违约率影响最大的N个指标。优选地,违约预测指标确定步骤具体包括如下本文档来自技高网
...

【技术保护点】
1.基于逻辑回归的银行对公贷款违约判别方法,其特征在于,包括如下步骤:/n违约预测指标预提取步骤,/n采用单因素方差分析法或多重共线性验证方法,根据数据库中的企业基本信息和企业财务指标,提取对违约率影响最大的N个指标;/n所述企业基本信息包括:企业名称、数据年度、是否违约、成立日期、在职员工数、总资产和借款人组织机构代码;/n所述企业财务指标:主营业务收入、流动比率、速动比率、现金比率、资产负债率、负债权益比率、利息保障倍数、存货周转率、应收账款周转率、营业周期、流动资产周转率、总资产周转率、固定资产周转率、总资产报酬率、成本费用利润率、销售净利率、净资产收益率、销售毛利率、盈余现金保障倍数、现金流动负债比、营业总成本、现金流动负债比、管理费用、销售费用、财务费用、无形资产、长期借款、短期借款、净利润和营业收入;/n违约预测指标确定步骤,/n根据预提取的N个指标,取方差累积贡献率达到预设阈值的指标作为违约预测的指标;/n二项逻辑回归模型建立步骤,/n将违约与否作为二项逻辑回归中的被解释变量,建立二项逻辑回归模型;/n违约判断步骤,/n根据二项逻辑回归模型及企业数据,得到违约概率;/n根据违约概率和预设的违约概率阈值,判断该企业是否违约。/n...

【技术特征摘要】
1.基于逻辑回归的银行对公贷款违约判别方法,其特征在于,包括如下步骤:
违约预测指标预提取步骤,
采用单因素方差分析法或多重共线性验证方法,根据数据库中的企业基本信息和企业财务指标,提取对违约率影响最大的N个指标;
所述企业基本信息包括:企业名称、数据年度、是否违约、成立日期、在职员工数、总资产和借款人组织机构代码;
所述企业财务指标:主营业务收入、流动比率、速动比率、现金比率、资产负债率、负债权益比率、利息保障倍数、存货周转率、应收账款周转率、营业周期、流动资产周转率、总资产周转率、固定资产周转率、总资产报酬率、成本费用利润率、销售净利率、净资产收益率、销售毛利率、盈余现金保障倍数、现金流动负债比、营业总成本、现金流动负债比、管理费用、销售费用、财务费用、无形资产、长期借款、短期借款、净利润和营业收入;
违约预测指标确定步骤,
根据预提取的N个指标,取方差累积贡献率达到预设阈值的指标作为违约预测的指标;
二项逻辑回归模型建立步骤,
将违约与否作为二项逻辑回归中的被解释变量,建立二项逻辑回归模型;
违约判断步骤,
根据二项逻辑回归模型及企业数据,得到违约概率;
根据违约概率和预设的违约概率阈值,判断该企业是否违约。


2.根据权利要求1所述的基于逻辑回归的银行对公贷款违约判别方法,其特征在于,采用单因素方差分析法提取对违约率影响最大的N个指标具体包括如下步骤:
每个指标单独与违约与否进行单因素方差分析,取设定年份内的数据,根据如下公式得到检验统计量F的值:



其中,
k为设定年份数;
n为数据库中该企业同行业内所有公司的数量;

为第i年数据库中该企业同行业内各公司对应该指标变量的均值;

为设定年份内数据库中该企业同行业内各公司对应该指标变量的总均值;
ni为第i年的样本量;
xij第i年数据库中该企业同行业内第j个公司对应该指标变量的取值;
根据得到的检验统计量F的数值,查询F分布表,得到检验p值;
选择N个p值最小的指标,作为对违约率影响最大的N个指标。


3.根据权利要求1所述的基于逻辑回归的银行对公贷款违约判别方法,其特征在于,通过多重共线性验证方法提取对违约率影响最大的N个指标具体包括如下步骤:
对各待检验指标进行多重共线性检验,检验公式为:c1X1+c2X2+…ciXi…+cnXn=c0,若存在c0,c1,c2,…,cn使得该公式成立,则待检验指标存在多重共线性;
其中,
Xi为第i个待检验指标;
ci为第i个待检验指标的系数;
c0为预设常数;
计算各待检验指标的拟合优度:



其中,
Rj为第j个待检验指标的拟合优度;
Yj为第j个待检验指标的真实值;
j为解释变量的序号;

为第j个待检验指标以其余指标为解释变量进行回归时得到的回归模型估计量;

为待检验指标真实值的均值;
对各待检验指标的拟合优度进行F检验:



其中,

为第j.个解释变量对其他解释变量的回归方程的判定系数;
k为解释变量的个数;
n为样本量;
j为解释变量的序号;
j.个用于F检验的解释变量的序号;
Fj为第j个待检验指标经过F检验后的拟合优度;
F(k-1,n-k)是指自由度从k-1到n-k的F分布;
根据对各指标的拟合优度进行F检验得到的检验结果,查询F分布表,得到检验p值;
选择N个p值最大的指标,作为对违约率影响最大的N个指标。


4.根据权利要求1所述的基于逻辑回归的银行对公贷款违约判别方法,其特征在于,违约预测指标确定步骤具体包括如下步骤:
由预提取的N个指标组成指标变量矩阵;
计算指标变量矩阵的协方差,得到指标变量协方差矩阵Σ;
计算指标变量协方差矩阵Σ的特征向量λ=(λ1,λ2,…,λN);
计算指标变量协方差矩阵Σ的特征向量λ中各特征值λi对应的特征向量γi;
计算特征值λi对应的违约预...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:北京大唐神州科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1