一种基于特征工程的企业风险评估方法技术

技术编号:25187743 阅读:45 留言:0更新日期:2020-08-07 21:14
本申请公开了一种基于特征工程的企业风险评估方法,该方法基于企业的税务数据构建基于税务的特征工程,并通过机器学习算法从中选择与征信风险相关联的特征,以作为风险评估指标;进而根据风险评估指标构建多个模型,并选出评估效果最好的模型,将该模型作为风险评估模型,用以对目标企业进行风险评估。可见,该方法剔除了以往评估方案的主观性,完全根据建模样本以及相关算法建立模型,从数据层面寻找与企业征信相关的指标因子并构建模型,能够更客观、更全面、更准确的量化企业的征信风险,降低信贷业务的风险。此外,本申请还提供了一种基于特征工程的企业风险评估装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应。

【技术实现步骤摘要】
一种基于特征工程的企业风险评估方法
本申请涉及计算机
,特别涉及一种基于特征工程的企业风险评估方法、装置、设备及可读存储介质。
技术介绍
目前,采用评分卡技术办理小微企业信贷业务,是富国银行、美国银行等先进银行的普遍做法。富国银行于1993年率先在小企业贷款中应用评分卡技术,并取得举世公认的业绩。调查显示,2005年,美国46%的社区银行在小企业信贷业务中使用评分卡技术,美国银行目前使用的评分卡有上百个之多。2012年,小微企业信贷业务首先在“信用贷”业务中使用评分卡技术,随后小微信用贷业务也通过评分卡评价客户。此后,越来越多的银行或者信贷机构通过评分卡来评价客户,从而给客户授信。企业征信也随着这些技术的发展而随之发展。征信业在中国从无到有,随着大数据时代的到来,征信业的发展更是突飞猛进,显然,企业征信制度可以解决一些信息不对称的问题,降低信息成本和交易成本,进而减轻逆向选择。征信体系能大规模高效率地收集、加工、处理交易的信息,尽可能降低交易过程中的不确定性,降低银行信息成本,也提高了银行贷款的质量。同时,企业征信制度使得本文档来自技高网...

【技术保护点】
1.一种基于特征工程的企业风险评估方法,其特征在于,包括:/nS1、获取企业的税务数据样本;/nS2、根据所述税务数据样本,构建基于税务的特征工程;/nS3、利用机器学习算法,对所述特征工程中的特征进行筛选,得到风险评估指标;/nS4、根据所述风险评估指标,构建多个模型;/nS5、根据各个所述模型在测试集上的评估效果,从所述多个模型中筛选出最优模型,以作为风险评估模型;/nS6、利用所述风险评估模型对目标企业进行评估,得到所述目标企业的风险评估结果。/n

【技术特征摘要】
1.一种基于特征工程的企业风险评估方法,其特征在于,包括:
S1、获取企业的税务数据样本;
S2、根据所述税务数据样本,构建基于税务的特征工程;
S3、利用机器学习算法,对所述特征工程中的特征进行筛选,得到风险评估指标;
S4、根据所述风险评估指标,构建多个模型;
S5、根据各个所述模型在测试集上的评估效果,从所述多个模型中筛选出最优模型,以作为风险评估模型;
S6、利用所述风险评估模型对目标企业进行评估,得到所述目标企业的风险评估结果。


2.如权利要求1所述的方法,其特征在于,在所述根据所述税务数据样本,构建基于税务的特征工程之前,还包括:
对所述税务数据样本进行清洗操作和加工操作,所述清洗操作包括缺失值处理和/或异常值处理,所述加工操作包括数据转置和/或数据求和。


3.如权利要求1所述的方法,其特征在于,所述根据所述风险评估指标,构建多个模型,包括:
利用分箱方法对所述风险评估指标进行分箱处理;
根据所述风险评估指标的分箱结果,构建多个模型。


4.如权利要求3所述的方法,其特征在于,所述根据所述风险评估指标的分箱结果,构建多个模型,包括:
利用多种模型拟合算法,根据所述风险评估指标的分箱结果构建多个模型,所述模型拟合算法包括以下任意一项或任意组合:决策树、梯度下降决策树、XGBOOST、逻辑回归。


5.如权利要求1所述的方法,其特征在于,所述利用所述风险评估模型对目标企业进行评估,得到所述目标企业的风险评估结果,包括:
获取目标企业的税务数据;
从所述税务数据中提取所述风险评估指标的指标数据;
将所述指标数据输入风险评估模型,得到所述目标企业的风险评估结果。


6.如权利要求1-5任意一项所述的方法,其特征在于,所述根据各个所...

【专利技术属性】
技术研发人员:张鸿林薛永营许卫赵彦晖
申请(专利权)人:深圳微众信用科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1