企业数据处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:33149109 阅读:15 留言:0更新日期:2022-04-22 14:02
本申请涉及一种企业数据处理方法、装置、计算机设备和存储介质。该方法包括:获取待评估企业对应的企业数据,将企业数据输入至训练好的信用风险评估模型中,通过信用风险评估模型根据企业数据对待评估企业进行预测,输出待评估企业对应的信用评估数值,其中,信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据,根据信用评估数值确定待评估企业对应的目标企业类别。采用本方法能够基于企业贷款场景数据,使用行业和品类的碳中和数据等进行企业风控建模,得到信用风险评估模型,信用风险评估模型能够准确地预测出企业的类别,根据企业的类别进而进行后续的贷款业务。类别进而进行后续的贷款业务。类别进而进行后续的贷款业务。

【技术实现步骤摘要】
企业数据处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种企业数据处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]在企业贷款场景中,申请贷款的企业的信用评估是一个必不可少的步骤。其中,对于一个申请贷款的企业,正确评估其违约的风险,并基于这个风险来决策是否给予其贷款,贷款年限以及贷款利率是企业贷款场景中最重要的环节之一。然而,在企业贷款风控建模中,相对个贷业务,企业相关数据通常有数据量较少,正负样本不平衡等特点。
[0003]而现阶段主要使用逻辑回归评分卡来进行信用评估,虽然逻辑回归具有较强的可解释性,但是其本质是一个线性模型,对于高维数据,需要复杂的特征工程才能够应用于模型中,并且对于非线性数据,逻辑回归模型的拟合效果较差,导致模型的精确度不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种企业数据处理方法、装置、计算机设备和存储介质,能够基于企业贷款场景数据,提出使用行业和品类的碳中和数据等进行企业风控建模,得到信用风险评估模型,信用风险评估模型能够准确地预测出企业的类别,根据企业的类别进而进行后续的贷款业务。
[0005]一种企业数据处理方法,该方法包括:
[0006]获取待评估企业对应的企业数据;
[0007]将企业数据输入至训练好的信用风险评估模型中,通过信用风险评估模型根据企业数据对待评估企业进行预测,输出待评估企业对应的信用评估数值,其中,信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据;
[0008]根据信用评估数值确定待评估企业对应的目标企业类别。
[0009]在其中一个实施例中,信用风险评估模型的训练步骤,包括:获取各候选企业对应的企业样本数据,企业样本数据包括多个不同特征下的训练数据,其中多个特征为候选企业基本信息特征、候选企业客户电力数据特征、候选企业碳排放数据特征,通过对各候选企业对应的企业样本数据进行数据筛选,得到各候选企业对应的企业训练数据,根据企业训练数据确定对应的候选企业的实际标签,将各候选企业对应的企业训练数据输入至初始信用风险评估模型,通过初始信用风险评估模型对企业训练数据进行计算,得到各候选企业对应的输出标签,根据实际标签和模型输出的输出标签计算得到训练损失值,根据训练损失值不断地调整初始信用风险评估模型的模型参数,直至满足收敛条件,得到训练好的信用风险评估模型。
[0010]在其中一个实施例中,通过对各候选企业对应的企业样本数据进行数据筛选,得到各候选企业对应的企业训练数据,包括:根据各候选企业对应的多个不同特征下的训练数据筛选得到各候选企业对应的中间特征集,根据各候选企业对应的中间特征集筛选得到
各候选企业对应的目标特征集,将目标特征集下的训练数据确定为对应的候选企业的企业训练数据。
[0011]在其中一个实施例中,根据各候选企业对应的多个不同特征下的训练数据筛选得到各候选企业对应的中间特征集,包括:获取当前候选企业对应的当前特征下的当前训练数据,根据当前训练数据计算得到当前特征评估值,当前特征评估值是用来体现当前特征对当前候选企业对应的预测能力的,根据当前特征评估值确定当前特征是否为当前候选企业对应的中间特征,从当前候选企业对应的多个不同特征中确定下一特征,将下一特征确定为当前特征,返回获取当前候选企业对应的当前特征下的当前训练数据的步骤,直至得到当前候选企业对应的中间特征集。
[0012]在其中一个实施例中,根据各候选企业对应的中间特征集筛选得到各候选企业对应的目标特征集,包括:计算当前候选企业对应的中间特征集中的各特征之间的特征相似值,根据特征相似值对中间特征集进行筛选,得到当前候选企业对应的目标特征集。
[0013]在其中一个实施例中,根据各候选企业对应的中间特征集筛选得到各候选企业对应的目标特征集,包括:从当前候选企业对应的中间特征集中确定当前特征,获取当前特征对应的当前训练数据,根据当前训练数据计算得到当前特征对应的当前特征系数,根据当前特征系数计算得到当前特征对应的当前特征变量值,当前特征变量值是剔除当前特征的共线性严重程度的,在当前特征变量值小于特征变量阈值时,确定当前特征为当前候选企业对应的目标特征,从当前候选企业对应的多个不同特征中确定下一特征,将下一特征确定为当前特征,返回获取当前特征对应的当前训练数据的步骤,直至得到各候选企业对应的目标特征集。
[0014]在其中一个实施例中,根据实际标签和输出标签计算得到训练损失值,包括:获取预设第一模型参数和预设第二模型参数,根据预设第一模型参数、第二模型参数和输出标签计算得到第一损失值,根据第二模型参数、实际标签和输出标签计算得到第二损失值,根据第一损失值和第二损失值计算得到训练损失值。
[0015]在其中一个实施例中,根据信用评估数值确定待评估企业对应的目标企业类别,包括:在信用评估数值超过预设信用评估阈值时,确定待评估企业对应的目标企业类别为第一类企业,允许待评估企业进行信贷申请,在信用评估数值未超过预设信用评估阈值时,确定待评估企业对应的目标企业类别为第二类企业,拒绝待评估企业进行信贷申请。
[0016]一种企业数据处理装置,该装置包括:
[0017]获取模块,用于获取待评估企业对应的企业数据;
[0018]输入模块,用于将企业数据输入至训练好的信用风险评估模型中,通过信用风险评估模型根据企业数据对待评估企业进行预测,输出待评估企业对应的信用评估数值,其中,信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据;
[0019]确定模块,用于根据信用评估数值确定待评估企业对应的目标企业类别。
[0020]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0021]获取待评估企业对应的企业数据;
[0022]将企业数据输入至训练好的信用风险评估模型中,通过信用风险评估模型根据企
业数据对待评估企业进行预测,输出待评估企业对应的信用评估数值,其中,信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据;
[0023]根据信用评估数值确定待评估企业对应的目标企业类别。
[0024]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0025]获取待评估企业对应的企业数据;
[0026]将企业数据输入至训练好的信用风险评估模型中,通过信用风险评估模型根据企业数据对待评估企业进行预测,输出待评估企业对应的信用评估数值,其中,信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据;
[0027]根据信用评估数值确定待评估企业对应的目标企业类别。
[0028]上述企业数据处理方法、装置、计算机设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业数据处理方法,所述方法包括:获取待评估企业对应的企业数据;将所述企业数据输入至训练好的信用风险评估模型中,通过所述信用风险评估模型根据所述企业数据对所述待评估企业进行预测,输出所述待评估企业对应的信用评估数值,其中,所述信用风险评估模型是通过多特征的企业样本数据进行训练得到的,企业样本数据包括企业碳中和数据;根据所述信用评估数值确定所述待评估企业对应的目标企业类别。2.根据权利要求1所述的方法,其特征在于,所述信用风险评估模型的训练步骤,包括:获取各候选企业对应的企业样本数据,所述企业样本数据包括多个不同特征下的训练数据,其中所述多个特征为所述候选企业基本信息特征、所述候选企业客户电力数据特征、所述候选企业碳排放数据特征;通过对各所述候选企业对应的企业样本数据进行数据筛选,得到各所述候选企业对应的企业训练数据;根据所述企业训练数据确定对应的候选企业的实际标签;将各所述候选企业对应的所述企业训练数据输入至初始信用风险评估模型,通过所述初始信用风险评估模型对所述企业训练数据进行计算,得到各所述候选企业对应的输出标签;根据所述实际标签和所述输出标签计算得到训练损失值,根据所述训练损失值不断地调整所述初始信用风险评估模型的模型参数,直至满足收敛条件,得到训练好的信用风险评估模型。3.根据权利要求2所述的方法,其特征在于,所述通过对各所述候选企业对应的企业样本数据进行数据筛选,得到各所述候选企业对应的企业训练数据,包括:根据各所述候选企业对应的多个不同特征下的训练数据筛选得到各所述候选企业对应的中间特征集;根据各所述候选企业对应的中间特征集筛选得到各所述候选企业对应的目标特征集;将目标特征集下的训练数据确定为对应的候选企业的企业训练数据。4.根据权利要求3所述的方法,其特征在于,所述根据各所述候选企业对应的多个不同特征下的训练数据筛选得到各所述候选企业对应的中间特征集,包括:获取当前候选企业对应的当前特征下的当前训练数据,根据所述当前训练数据计算得到当前特征评估值,所述当前特征评估值是用来体现所述当前特征对所述当前候选企业对应的预测能力的;根据所述当前特征评估值确定所述当前特征是否为所述当前候选企业对应的中间特征;从所述当前候选企业对应的多个不同特征中确定下一特征,将所述下一特征确定为当前特征,返回所述获取当前候选企业对应的当前特征下的当前训练数据的步骤,直至得到所述当前候选企业对应的中间特征集。5.根据权利要求3所述的方法,其特征在于,所述根据各所述候选企业对应的中间特征集筛选得到各所述候选企业对应的目标特征...

【专利技术属性】
技术研发人员:余辉彭坤杨明明
申请(专利权)人:南京星云数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1