一种融合电力数据的企业信用预测方法技术

技术编号:34471959 阅读:15 留言:0更新日期:2022-08-10 08:46
本发明专利技术涉及一种融合电力数据的企业信用预测方法,包括:确定入模样本;进行特征转换、标签粗筛和标签筛选;通过机器学习和统计建模,划分并训练数据进行建模,获取融合电力数据的企业信用评分卡模型;计算企业信用评分分数以及对应的风险等级。与现有技术相比,本发明专利技术具有有效提升电力交易中风险防控的有效性与及时性、客观真实等优点。客观真实等优点。客观真实等优点。

【技术实现步骤摘要】
一种融合电力数据的企业信用预测方法


[0001]本专利技术涉及企业信用预测
,尤其是涉及一种融合电力数据的企业信用预测方法。

技术介绍

[0002]企业间关联合作越来越密切,但是企业贸易合作中商业风险无处不在,企业作为经济实体,在寻求合作投资时需要了解合作方的基本信息作为投资参考,企业自身更需要认清发展的利弊,提升企业品牌形象。随着企业数以及交易信息数据的增长,其产生的数据量也越来越多,并且每年呈指数级增长,如何在这些数据中挖掘企业信用信息已经成为了金融领域的重中之重。
[0003]目前,售电市场已经开放,客户和售电公司双向独立进行交易,在这个过程中,双方都需要对对方的信用作出准确的判断,而现有技术中还未有一种基于用电信用对企业信用进行预测的技术。

技术实现思路

[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种有效提升电力交易中风险防控的有效性与及时性、客观真实的融合电力数据的企业信用预测方法。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种融合电力数据的企业信用预测方法,所述的企业信用预测方法包括:
[0007]步骤1:确定入模样本;
[0008]步骤2:进行特征转换、标签粗筛和标签筛选;
[0009]步骤3:通过机器学习和统计建模,划分并训练数据进行建模,获取融合电力数据的企业信用评分卡模型;
[0010]步骤4:计算企业信用评分分数以及对应的风险等级。
[0011]优选地,所述的步骤1具体为:
[0012]步骤1

1:对样本进行初筛;
[0013]步骤1

2:基于客群分类与欠费等级确定抽样比例表;
[0014]步骤1

3:基于抽样比例表对初筛后的样本进行抽样。
[0015]优选地,所述步骤2中的特征转换具体为:
[0016]首先,采用卡方分箱法对标签变量进行分箱;
[0017]然后,进行基于证据权重WOE进行WOE转换。
[0018]优选地,所述步骤2中的标签粗筛具体为:
[0019]在完成特征转换后,对标签变量进行单因素分析和多因素分析,粗筛出典型入模标签。
[0020]优选地,所述步骤2中的标签筛选具体为:
[0021]选用多种评价方法,基于TOPSIS模型对粗筛后的标签进行标签筛选。
[0022]更加优选地,所述的标签筛选的具体方法为:
[0023]基于粗筛后的标签特征构建四种集成树模型,包括随机森林模型、GBDT模型、极限随机森林模型和XGBoost模型,并输出各个标签特征的重要性评分;
[0024]计算三种特征评分指标,包括标签特征与好坏标签的相关系数、互信息值和IV值;
[0025]形成m
×
n矩阵向量,其中m为标签特征个数,n为选取的评价方法数量,并基于下式进行特征向量规范化;
[0026][0027]其中,x
ij
为m
×
n矩阵向量中的元素,z
ij
为进行规范化后的m
×
n矩阵向量中的元素;
[0028]基于规范化后的矩阵,对各个评价方法评分加权;
[0029]计算最优虚拟解与最劣虚拟解:
[0030]Z

=(min{z
11
,z
21
,

,z
n1
},min{z
12
,z
22
,

,z
n2
}

min{z
1m
,z
2m
,

,z
nm
})
[0031]=(Z1‑
,Z2‑
,

,Z
m

)
[0032]Z
+
=(max{z
11
,z
21
,

,z
n1
},max{z
12
,z
22
,

,z
n2
}

max{z
1m
,z
2m
,

,z
nm
})
[0033]=(Z
1+
,Z
2+
,

,Z
m+
)
[0034]计算各个标签特征距离最优解和最劣解的欧式距离:
[0035][0036][0037]其中,w
j
为预设的评估方法权重;
[0038]获取各个标签特征的综合评分:
[0039][0040]基于综合评分排序对标签进行筛选。
[0041]优选地,所述的步骤3具体为:
[0042]基于步骤1确定的入模样本以及步骤2筛选出的特征标签对机器学习模型进行训练,获得企业信用评分卡模型。
[0043]更加优选地,所述的机器学习模型具体为逻辑回归模型。
[0044]优选地,所述步骤4中计算企业信用评分分数的具体方法为:
[0045]基于训练好的企业信用评分卡模型进行分数映射,获得企业信用评价分数。
[0046]优选地,所述步骤4中风险等级的获取方法为:
[0047]基于企业信用评价分数以及预设各等级阈值获取当前企业的信用风险等级。
[0048]与现有技术相比,本专利技术具有以下有益效果:
[0049]一、有效提升电力交易中风险防控的有效性与及时性:本专利技术中的企业信用预测方法基于企业信用评分卡来计算评价分数从而获得企业信用风险等级,有效提升了电力交易中风险防控的有效性与及时性。
[0050]二、客观真实:本专利技术中的企业信用预测方法构建了TOPSIS综合评估模型,针对待
选入模特征,综合考虑了不同模型或者方法对于特征重要性的计算结果最终基于TOPSIS模型获取了各标签的特征综合重要性得分,有效削弱了单个特征重要性评估方式的片面性以及主观性。
附图说明
[0051]图1为本专利技术中企业信用预测方法的流程示意图;
[0052]图2为本专利技术实施例中观察点、观察期和表现期的关系。
具体实施方式
[0053]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。
[0054]一种融合电力数据的企业信用预测方法,其流程如图1所示,包括:
[0055]步骤1:确定入模样本;
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合电力数据的企业信用预测方法,其特征在于,所述的企业信用预测方法包括:步骤1:确定入模样本;步骤2:进行特征转换、标签粗筛和标签筛选;步骤3:通过机器学习和统计建模,划分并训练数据进行建模,获取融合电力数据的企业信用评分卡模型;步骤4:计算企业信用评分分数以及对应的风险等级。2.根据权利要求1所述的一种融合电力数据的企业信用预测方法,其特征在于,所述的步骤1具体为:步骤1

1:对样本进行初筛;步骤1

2:基于客群分类与欠费等级确定抽样比例表;步骤1

3:基于抽样比例表对初筛后的样本进行抽样。3.根据权利要求1所述的一种融合电力数据的企业信用预测方法,其特征在于,所述步骤2中的特征转换具体为:首先,采用卡方分箱法对标签变量进行分箱;然后,进行基于证据权重WOE进行WOE转换。4.根据权利要求1所述的一种融合电力数据的企业信用预测方法,其特征在于,所述步骤2中的标签粗筛具体为:在完成特征转换后,对标签变量进行单因素分析和多因素分析,粗筛出典型入模标签。5.根据权利要求1所述的一种融合电力数据的企业信用预测方法,其特征在于,所述步骤2中的标签筛选具体为:选用多种评价方法,基于TOPSIS模型对粗筛后的标签进行标签筛选。6.根据权利要求5所述的一种融合电力数据的企业信用预测方法,其特征在于,所述的标签筛选的具体方法为:基于粗筛后的标签特征构建四种集成树模型,包括随机森林模型、GBDT模型、极限随机森林模型和XGBoost模型,并输出各个标签特征的重要性评分;计算三种特征评分指标,包括标签特征与好坏标签的相关系数、互信息值和IV值;形成m
×
n矩阵向量,其中m为标签特征个数,n为选取的评价方法数量,并基于下式进行特征向量规范化;其中,x
ij
为m
×
n矩阵向量中的元素,z
ij
为进行规范化后的m
×
n矩阵向量中的元素;基于规范化后的矩阵,对各个评价方法评分加权;计算最优虚拟解与最劣虚拟解:Z

=(min{z
11
,z
21
,

,z
n1
}...

【专利技术属性】
技术研发人员:郭乃网苏运田英杰赵莹莹吴裔李凡余凯李靖雯沈泉江王彬彬刘畅
申请(专利权)人:星环信息科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1