企业信贷评估方法及系统技术方案

技术编号:28784986 阅读:20 留言:0更新日期:2021-06-09 11:19
本发明专利技术涉及一种企业信贷评估方法及系统,方法包括获取企业信贷数据;利用机器学习算法GBDT构建违约判别模型;根据违约率和企业经营能力计算信贷风险指数;结合违约率、企业经营能力和信贷风险指数构建信誉评级模型,基于信誉评级模型对企业信誉进行评级;通过违约率、企业经营能力、信贷风险指数和信誉评级构建信贷评估模型,基于信贷评估模型确定对企业的信贷决策并量化贷款额度。本发明专利技术在企业借贷时协助银行等金融机构全面了解申请企业的信用状况,结合违约率、企业经营能力、信贷风险指数和信誉评级确定对企业的信贷决策并量化贷款额度,显著降低了银行的信贷风险,而且能够实现线上实时审批,大大提升了银行放贷效率。大大提升了银行放贷效率。大大提升了银行放贷效率。

【技术实现步骤摘要】
企业信贷评估方法及系统


[0001]本专利技术涉及信贷审批授信
,尤其是指一种企业信贷评估方法及系统。

技术介绍

[0002]对于中小微企业而言,银行信贷可以确保企业的资金流动,在企业基础设施建设、重点项目推动、日常运营和突发情况应急等多方面能够提供很大的帮助。目前,针对中小微企业信贷违约概率评估问题,现有技术大多以传统风控模式为主,采取线下审核企业征信材料的方式,其侧重于专家级人工校验,缺少对企业风险的综合计算,其评估结果往往容易被专家的知识、经验和偏好等因素影响,容易发生误判的情况,其准确性较低,因此在银行信贷过程中,三角债、恶意拖欠、骗贷和逃废银行债务等现象不断发生,而且传统的信贷评估方式需要多级审批,其审核周期较长,同时有着很长的审核周期,其效率较低。
[0003]因此,迫切需要寻求一种新的信贷评估方法,以便银行在借贷前能够全面了解借款人的信用状况。

技术实现思路

[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中的信贷评估方法存在评估准确性低及评估效率低的问题。
[0005]为解决上述技术问题,本专利技术的一个目的提供了一种企业信贷评估方法,包括:
[0006]获取企业信贷数据,信贷数据包括发票数据和企业基本信息,其中发票数据包括销项发票数据,将所述销项发票数据通过K

means聚类算法进行分类,得到企业规模分类结果;
[0007]提取所述信贷数据的特征维度,将所述企业规模分类结果作为一个特征维度,并与提取的信贷数据的特征维度相结合作为机器学习算法GBDT的训练数据,利用所述机器学习算法GBDT构建违约判别模型,基于所述违约判别模型评估企业的违约率,同时根据所述特征维度计算企业经营能力;
[0008]根据所述违约率和企业经营能力计算信贷风险指数;
[0009]结合所述违约率、企业经营能力和信贷风险指数构建信誉评级模型,基于所述信誉评级模型对企业信誉进行评级;
[0010]通过所述违约率、企业经营能力、信贷风险指数和信誉评级构建信贷评估模型,基于所述信贷评估模型确定对企业的信贷决策并量化贷款额度。
[0011]在本专利技术的一个实施例中,将所述销项发票数据通过K

means聚类算法进行分类包括:
[0012]在销项发票的数据集中随机选取k个样本数据作为起始的聚类中心μ
i
,其中i为聚类中心索引;
[0013]分别计算数据集中每个样本数据x
j
到k个聚类中心的距离,计算公式为:式中,μ
i
为聚类中心,x
j
为样本数据,j为样本数据索引;
[0014]根据计算得到的距离将样本数据x
j
划分至距离最近的聚类中心,并根据欧拉公式重新计算聚类中心,欧拉公式为:其中x
i
,x
j
为两条离散的样本数据,x
iu
、x
ju
分别为x
i
、x
j
在字段索引u上的取值;
[0015]重复所述聚类过程,直至算法收敛,得到聚类结果。
[0016]在本专利技术的一个实施例中,利用所述机器学习算法GBDT构建违约判别模型包括:
[0017]将训练数据整理为训练数据集,记为T={(x1,y1),(x2,y2),...,(x
i
,y
i
)},其中x
i
为训练数据的输入值,X为输入数据集合,y
i
为训练数据的输出值,Y为输出数据集合,i为数据索引;
[0018]使用所述训练数据集执行所述机器学习算法GBDT的训练学习,并输出强学习器F
M
(x)的表达式。
[0019]在本专利技术的一个实施例中,使用所述训练数据集执行所述机器学习算法GBDT的训练学习,并输出强学习器F
M
(x)的表达式包括:
[0020]输入训练数据集T、损失函数L及最大迭代次数t,其中损失函数为L(y,f(x));
[0021]对弱学习器F0(x)进行初始化,式中c为常数,y
i
为训练数据的输出值,i为数据索引,N为数据的个数;
[0022]通过t次迭代计算更新强学习器F
m
(x);
[0023]输出强学习器F
M
(x)的表达式。
[0024]在本专利技术的一个实施例中,通过t次迭代计算更新强学习器F
m
(x),输出强学习器F
M
(x)的表达式包括:
[0025]建立M棵分类回归树m=1,2,...,M,计算第m棵树对应的响应值r
m,i
,式中i为数据索引,y
i
为训练数据的输出值,F(x)为学习器得到的预测值,L(y,f(x))为损失函数,m为分类回归树索引;
[0026]利用CART回归树拟合数据(x
i
,r
m,i
),得到第m棵回归树,其对应的叶子节点区域为R
m,j
,其中j=1,2,...,J
m
,J
m
为第m棵回归树叶子节点的个数;
[0027]对于J
m
个叶子节点区域j=1,2,...,J
m
,计算出最佳拟合值c
m,j
,式中x
i
为训练数据的输入值,y
i
为训练数据的输出值,F(x)为学习器得到的预测值,L(y,f(x))为损失函数,c为常数,R
m,j
为叶子节点区域;
[0028]更新强学习器F
m
(x),式中m为分类回归树索引,j=1,2,...,J
m
,J
m
为第m棵回归树叶子节点的个数,c
m,j
为最佳拟合值,R
m,j
为叶子节点区域,I为指示函数,当x∈R
m,j
为true时,输出为1,否则输出为0;
[0029]输出强学习器F
M
(x)的表达式:式中F0(x)为初
始化的弱学习器,m为分类回归树索引,M为最大树索引,j=1,2,...,J
m
,J
m
为第m棵回归树叶子节点的个数,c
m,j
为最佳拟合值,I为指示函数,当x∈R
m,j
为true时,输出为1,否则输出为0。
[0030]在本专利技术的一个实施例中,根据所述特征维度计算企业经营能力,所述企业经营能力包括风险得分指标,所述风险得分指标的计算公式如下:
[0031][0032][0033]式中,s0为初始风险得分,v
c
为消费总额增速,v
s
为销售总额增速,t为经营天数,e为自然对数,s为最终风险得分。...

【技术保护点】

【技术特征摘要】
1.一种企业信贷评估方法,其特征在于,包括:获取企业信贷数据,信贷数据包括发票数据和企业基本信息,其中发票数据包括销项发票数据,将所述销项发票数据通过K

means聚类算法进行分类,得到企业规模分类结果;提取所述信贷数据的特征维度,将所述企业规模分类结果作为一个特征维度,并与提取的信贷数据的特征维度相结合作为机器学习算法GBDT的训练数据,利用所述机器学习算法GBDT构建违约判别模型,基于所述违约判别模型评估企业的违约率,同时根据所述特征维度计算企业经营能力;根据所述违约率和企业经营能力计算信贷风险指数;结合所述违约率、企业经营能力和信贷风险指数构建信誉评级模型,基于所述信誉评级模型对企业信誉进行评级;通过所述违约率、企业经营能力、信贷风险指数和信誉评级构建信贷评估模型,基于所述信贷评估模型确定对企业的信贷决策并量化贷款额度。2.根据权利要求1所述的企业信贷评估方法,其特征在于:将所述销项发票数据通过K

means聚类算法进行分类包括:在销项发票的数据集中随机选取k个样本数据作为起始的聚类中心μ
i
,其中i为聚类中心索引;分别计算数据集中每个样本数据x
j
到k个聚类中心的距离,计算公式为:式中,μ
i
为聚类中心,x
j
为样本数据,j为样本数据索引;根据计算得到的距离将样本数据x
j
划分至距离最近的聚类中心,并根据欧拉公式重新计算聚类中心,欧拉公式为:其中x
i
,x
j
为两条离散的样本数据,x
iu
、x
ju
分别为x
i
、x
j
在字段索引u上的取值;重复所述聚类过程,直至算法收敛,得到聚类结果。3.根据权利要求1所述的企业信贷评估方法,其特征在于:利用所述机器学习算法GBDT构建违约判别模型包括:将训练数据整理为训练数据集,记为T={(x1,y1),(x2,y2),...,(x
i
,y
i
)},其中x
i
为训练数据的输入值,X为输入数据集合,y
i
为训练数据的输出值,Y为输出数据集合,i为数据索引;使用所述训练数据集执行所述机器学习算法GBDT的训练学习,并输出强学习器F
M
(x)的表达式。4.根据权利要求3所述的企业信贷评估方法,其特征在于:使用所述训练数据集执行所述机器学习算法GBDT的训练学习,并输出强学习器F
M
(x)的表达式包括:输入训练数据集T、损失函数L及最大迭代次数t,其中损失函数为L(y,f(x));对弱学习器F0(x)进行初始化,式中c为常数,y
i
为训练数据的输出值,i为数据索引,N为数据的个数;通过t次迭代计算更新强学习器F
m
(x);
输出强学习器F
M
(x)的表达式。5.根据权利要求4所述的企业信贷评估方法,其特征在于:通过t次迭代计算更新强学习器F
m
(x),输出强学习器F
M
(x)的表达式包括:建立M棵分类回归树m=1,2,...,M,计算第m棵树对应的响应值r
m,i
,式中i为数据索引,y
i
为训练数据的输出值,F(x)为学习器得到的预测值,L(y,f(x))为损失函数,m为分类回归树索引;利用CART回归树拟合数据(x
i
,r
m,i
),得到第m棵回归树,其对应的叶子节点区域为R
m,j
,其中j=1,2,...,J
m
,J
m
为第m棵回归树叶子节点的个数;对于J
m
个叶子节点区域j=1,2,...,J
m
,计算出最佳拟合值c
m,j
,式中x
i
为训练数据的输入值,y
i
...

【专利技术属性】
技术研发人员:姜俊杰谢绍韫
申请(专利权)人:苏州黑云智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1