风控模型建模、企业风险评估方法、装置和存储介质制造方法及图纸

技术编号:20919084 阅读:14 留言:0更新日期:2019-04-20 10:13
本申请涉及一种风控模型建模方法、装置、计算机设备和存储介质,获取正样本数据集和负样本数据集、验证数据集,将验证数据集、正样本数据集和负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型,将验证数据集、正样本数据集和负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将企业评分模型与异常检验评分模型结合,获得风控模型,企业评分模型结合异常检验评分模型进行企业风险评分降低结果误差,进一步提高了风控模型准确率和稳定性。

Wind Control Model Modeling, Enterprise Risk Assessment Methods, Devices and Storage Media

This application involves a wind control model modeling method, device, computer equipment and storage medium, acquiring positive and negative sample data sets, validating data sets, and inputting validating data sets, positive and negative sample data sets into the machine learning model to be trained, until the training conditions are met, the enterprise scoring model is obtained, and the validating data sets, positive and negative sample data sets are obtained. Sample data sets and negative sample data sets are taken as the sample characteristics of anomaly test scoring model, and anomaly test scoring model is obtained. Wind control model is obtained by combining enterprise scoring model with anomaly test scoring model. Enterprise scoring model combines with anomaly test scoring model to reduce the result error of enterprise risk scoring, which further improves the accuracy and stability of wind control model.

【技术实现步骤摘要】
风控模型建模、企业风险评估方法、装置和存储介质
本申请涉及互联网
,特别是涉及一种风控模型建模、企业风险评估方法、装置、计算机设备和存储介质。
技术介绍
随着互联网技术的不断发展,根据业务需要,需要对有意向成为合作关系的企业进行企业风险判断,以免造成不必要的损失,由人工收集企业相关的信息转换为利用互联网技术收集数据,根据用户经验判断企业风险改为风控模型进行企业风险评估。目前风控建模一般使用传统的机器学习方法,例如使用逻辑回归模型建立评分卡。这种有监督学习方法是基于历史数据的负样本学习而来的,且需要较为均衡的已知标签的正负样本。正负样本的需要相关的获取途径获得,如:根据与客户之间的交易过程中获取,但在进行交易前,风控系统会基于对客户的风险判断,决定是否与该客户交易,当该客户为高危客户时,会拒绝与该客户交易,因为被拒绝的客户了往往没有了标签,导致训练样本的分布与现实数据的分布有较大差异,因此导致建立的风控模型准确率和稳定性不高。
技术实现思路
基于此,有必要针对上述技术问题,提供一种提高风控模型准确率和稳定性的风控模型建模、企业风险评估方法、装置、计算机设备和存储介质。一种风控模型建模方法,包括:获取正样本数据集、负样本数据集和验证数据集;将所述验证数据集、所述正样本数据集和所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将所述企业评分模型与异常检验评分模型结合,获得风控模型。在其中一个实施例中,将所述验证数据集、所述正样本数据集与所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型的步骤,包括:将所述正样本数据集与所述负样本数据集输入待训练的机器学习模型;所述待训练的机器学习模型基于所述正样本数据集与所述负样本数据集,根据相应的数据特征向量,获得训练后的机器学习模型;将所述验证数据集输入所述训练后的机器学习模型进行评分,获得企业风险评分;当所述企业风险评分在预设范围内,满足训练条件,获得企业评分模型。在其中一个实施例中,将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型的步骤,包括:将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征进行特征提取,获得各样本特征的特征向量;将各所述特征向量进行聚类,获得各群簇;根据各群簇的特征空间分布,确定出各群簇中贡献最大的样本特征;将贡献度最大的样本特征作为风控模型的评估特征,获得异常检验评分模型。在其中一个实施例中,将所述企业评分模型与异常检验评分模型结合,获得风控模型的步骤,包括:基于所述企业评分模型输出的第一企业风险评分与异常检验评分模型输出的第二企业风险评分求平均值的方式进行结合,获得风控模型。在其中一个实施例中,获取正样本数据集和负样本数据集、验证数据集的步骤包括:获取各企业的企业财务数据样本、发票信息样本、企业经营数据样本;将所述企业财务数据样本、所述发票信息样本、所述企业经营数据样本基于数据标签与正负样本清单进行匹配,获得正样本数据集和负样本数据集;将未匹配成功的所述财务数据样本、所述发票信息样本、所述企业经营数据样本作为验证数据集。一种企业风险评估方法,所述方法包括:获取待评分企业的企业财务数据、发票信息、企业经营数据;将所述企业财务数据、所述发票信息、所述企业经营数据输入所述的风控模型进行企业风险评估,获得企业风险评估结果。一种风控模型建模装置,通过所述装置包括:数据集获取模块,用于获取正样本数据集和负样本数据集、验证数据集;企业评分模型训练模块,用于将所述验证数据集、所述正样本数据集和所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;异常检验评分模型建立模块,用于将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;模型结合模块,用于将所述企业评分模型与异常检验评分模型结合,获得风控模型。一种企业风险评估装置,所述装置包括:数据获取模块,用于获取待评分企业的企业财务数据、发票信息、企业经营数据;企业风险评分模块,用于将所述企业财务数据、所述发票信息、所述企业经营数据输入所述的风控模型进行企业风险评分,获得企业风险值。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的方法的步骤。上述风控模型建模方法、装置、计算机设备和存储介质,获取正样本数据集和负样本数据集、验证数据集,将验证数据集、正样本数据集和负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型,将验证数据集、正样本数据集和负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将企业评分模型与异常检验评分模型结合,获得风控模型,企业评分模型结合异常检验评分模型进行企业风险评分降低结果误差,进一步提高了风控模型准确率和稳定性。上述企业风险评估方法、装置、计算机设备和存储介质,通过获取待评分企业的企业财务数据、发票信息、企业经营数据;将企业财务数据、发票信息、企业经营数据输入的风控模型进行企业风险评估,获得企业风险评估结果,风控模型将企业财务数据、发票信息、企业经营数据通过企业评分模型与异常检验评分模型结合进行企业风险评分降低结果误差,提高了企业风险评估的准确率。附图说明图1为一个实施例中风控模型建模方法的应用场景图;图2为一个实施例中风控模型建模方法的流程示意图;图3为另一个实施例中企业风险评估方法的流程示意图;图4为一个实施例中风控模型建模装置的结构框图;图5为一个实施例中企业风险评估装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的风控模型建模方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。用户通过终端102对执行风控模型建模方法的服务器104进行设置,使得服务器104获取正样本数据集、负样本数据集和验证数据集;将验证数据集、正样本数据集和负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;将验证数据集、正样本数据集和负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将企业评分模型与异常检验评分模型结合,获得风控模型。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种风控模型建模方法,以该方法应用于图1中的服务器为例进行说明,包括步骤S220至步骤S280:步骤S220,获取正样本数据集、负样本数据集本文档来自技高网...

【技术保护点】
1.一种风控模型建模方法,包括:获取正样本数据集、负样本数据集和验证数据集;将所述验证数据集、所述正样本数据集和所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将所述企业评分模型与异常检验评分模型结合,获得风控模型。

【技术特征摘要】
1.一种风控模型建模方法,包括:获取正样本数据集、负样本数据集和验证数据集;将所述验证数据集、所述正样本数据集和所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型;将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型;将所述企业评分模型与异常检验评分模型结合,获得风控模型。2.根据权利要求1所述的风控模型建模方法,其特征在于,将所述验证数据集、所述正样本数据集与所述负样本数据集输入待训练的机器学习模型进行训练,直至满足训练条件后,获得企业评分模型的步骤,包括:将所述正样本数据集与所述负样本数据集输入待训练的机器学习模型;所述待训练的机器学习模型基于所述正样本数据集与所述负样本数据集,根据相应的数据特征向量,获得训练后的机器学习模型;将所述验证数据集输入所述训练后的机器学习模型进行评分,获得企业风险评分;当所述企业风险评分在预设范围内,满足训练条件,获得企业评分模型。3.根据权利要求1所述的风控模型建模方法,其特征在于,将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征,获得异常检验评分模型的步骤,包括:将所述验证数据集、所述正样本数据集和所述负样本数据集作为异常检验评分模型的样本特征进行特征提取,获得各样本特征的特征向量;将各所述特征向量进行聚类,获得各群簇;根据各群簇的特征空间分布,确定出各群簇中贡献最大的样本特征;将贡献度最大的样本特征作为风控模型的评估特征,获得异常检验评分模型。4.根据权利要求1所述的风控模型建模方法,其特征在于,将所述企业评分模型与异常检验评分模型结合,获得风控模型的步骤,包括:基于所述企业评分模型输出的第一企业风险评分与异常检验评分模型输出的第二企业风险评分求平均值的方式进行结合,获得风控模型。5.根据权利要求1所述的风控模型建模...

【专利技术属性】
技术研发人员:张翔刘媛源郑子欧于修铭汪伟肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1