面向企业家族的小微企业信用评估模型构建方法及系统技术方案

技术编号:22445165 阅读:34 留言:0更新日期:2019-11-02 04:55
本发明专利技术公开了一种面向企业家族的小微企业信用评估模型构建方法及系统,属于企业信用评估领域,要解决的技术问题为如何实现面向企业家族的小微企业信用评估。方法包括:获取样本数据;将上述样本数据划分为训练集和评估集;通过随机森林方法构建评估模型,评估模型由企业主信用评估子模型和企业行为信用评估子模型组成,以企业主信用评估子模型和企业行为信用评估子模型信用分的加权和作为评估模型的评估输出;以训练集为输入,通过十折交叉验证算法和参数网格优选算法对评估模型进行训练;以评估集为输入,通过网格搜索方法对初始评估模型进行参数微调。系统包括数据采集模块、样本划分模块、模型构建模块、模型训练模块和模型优化模块。

Method and system of credit evaluation model of small and micro enterprises for business family

【技术实现步骤摘要】
面向企业家族的小微企业信用评估模型构建方法及系统
本专利技术涉及企业信用评估领域,具体地说是一种面向企业家族的小微企业信用评估模型构建方法及系统。
技术介绍
企业主家族的小微企业在扩大就业、改善民生、促进稳定等方面具有举足轻重的作用,而此类小微企业因其抗风险能力弱、抵质押品少、经营管理不正规、信用信息不透明、信用评估难度大等问题无法满足银行的授信政策,导致很大程度无法获得银行贷款。为此提出一种面向企业主家族的小微企业信用评估办法,借助运营商大数据从企业主本身和企业行为进行信用评估,补充银行授信标准,提升小微企业的银行贷款通过率,更好服务小微。基于上述,如何实现面向企业家族的小微企业信用评估,是需要解决的技术问题。
技术实现思路
本专利技术的技术任务是针对以上不足,提供一种面向企业家族的小微企业信用评估模型构建方法及系统,来解决如何实现面向企业家族的小微企业信用评估的问题。第一方面,本专利技术提供一种面向企业家族的小微企业信用评估模型构建方法,包括如下步骤:获取样本数据,所述样本数据包括多个特征指标及和多个信用分数据,所述多个特征指标为基于小微企业画像特征提取的征信评估属性,所述多个信用分本文档来自技高网...

【技术保护点】
1.面向企业家族的小微企业信用评估模型构建方法,其特征在于包括如下步骤:获取样本数据,所述样本数据包括多个特征指标及和多个信用分数据,所述多个特征指标为基于小微企业画像特征提取的征信评估属性,所述多个信用分数据来自运营商的和信分和互联网平台;将上述样本数据划分为训练集和评估集;通过随机森林方法构建评估模型,所述评估模型由企业主信用评估子模型和企业行为信用评估子模型组成,并设置影响权重,以企业主信用评估子模型和企业行为信用评估子模型信用分的加权和作为评估模型的评估输出;以训练集为输入,通过十折交叉验证算法和参数网格优选算法对所述评估模型进行训练,并采用正则化方法对十折交叉验证算法和参数网格优选算...

【技术特征摘要】
1.面向企业家族的小微企业信用评估模型构建方法,其特征在于包括如下步骤:获取样本数据,所述样本数据包括多个特征指标及和多个信用分数据,所述多个特征指标为基于小微企业画像特征提取的征信评估属性,所述多个信用分数据来自运营商的和信分和互联网平台;将上述样本数据划分为训练集和评估集;通过随机森林方法构建评估模型,所述评估模型由企业主信用评估子模型和企业行为信用评估子模型组成,并设置影响权重,以企业主信用评估子模型和企业行为信用评估子模型信用分的加权和作为评估模型的评估输出;以训练集为输入,通过十折交叉验证算法和参数网格优选算法对所述评估模型进行训练,并采用正则化方法对十折交叉验证算法和参数网格优选算法进行约束;以评估集为输入,通过网格搜索方法对所述初始评估模型进行参数微调,得到最终的评估模型。2.根据权利要求1所述的面向企业家族的小微企业信用评估方法,其特征在于将上述样本数据划分为训练集和评估集之前,对样本数据进行预处理;所述预处理包括如下步骤:对样本数据进行NULL值填充,填充指标为所述样本数据的均值;对样本数据进行异常值处理,将差于阈值的样本数据删除,所述阈值通过指标斜率图确定;基于指标取值标准化公式对样本数据进行归一化处理,以便于将样本数据限定于同一区间中,指标取值标准化公式为:其中,x表示归一化处理前的指标值,表示归一化后的指标值,xmin表示当前指标值中的最小值,xmax表示当前指标值中的最大值。3.根据权利要求2所述的面向企业家族的小微企业信用评估模型构建方法,其特征在于对样本数据进行预处理后,对特征指标进行降维处理;所述对特征指标进行降维处理包括如下步骤:通过sparkfeaturelabel分组方法对预处理后的样本数据进行分组处理,将特征指标数据与信用分数据分离;计算每个特征指标数据的重要性,并剔除重要性低的特征指标数据,所述特征指标数据重要性的计算公式为:特征指标数据的重要性=∑(errOOB2-errOOB1)/NtreeerrOOB1为随机森林袋外数据计算所得误差,errOOB2为对袋外数据加入噪声干扰所得误差,Ntree为随机森林算法中树的棵数;通过卡方检验公式计算特征指标数据的卡方值,基于置信度、卡方值和自由度选择与信用分数据有显著关系的指标特征数据,卡方检验公式为:其中,X表示特征指标数据,observed表示观察值,expected表示理论值。4.根据权利要求1、2或3所述的面向企业家族的小微企业信用评估模型构建方法,其特征在于获取样本数据之前,构建样本库,通过对样本库进行画像分析得到小微企业画像特征;所述构建样本库包括如下步骤:采集运营商数据、互联网数据和行业数据,并将上述运营商数据、互联网数据和行业数据加载至数据共享平台中,所述数据共享平台为基于多数据源、松耦合、高异构原则构建的数据共享平台;将加载的所述数据以指定的清洗规则进行异常数据清洗,得到清洗后数据;通过数据关联方法将上述清洗后数据进行数据融合,将上述加载的数据整合至一张数据表中;基于数据颗粒度,汇总上述融合后的数据,得到样本库。5.根据权利要求4所述的面向企业家族的小微企业信用评估模型构建方法,其特征在于通过离线采集、实时采集、爬虫及通过合作伙伴引入的方式采集运营商数据、互联网数据和行业数据。6.根据权利要求1、2或3所述的面向企业家族的小微企业信用评估模型构建方法,其特征在于所述多个特征指标包括但不限于身份信息、位置信息、社交信息、消费信息、信用历史、行为信息、工商信息和行业信息。7....

【专利技术属性】
技术研发人员:沈林江张笑笑
申请(专利权)人:浪潮软件集团有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1