This application provides a risk identification method for enterprise shell risk identification, which includes acquiring enterprise shell sample set, training the enterprise shell sample set through at least two machine learning algorithms to obtain shell recognition model, in which the shell recognition model includes at least two decision tree models, and acquiring information of the enterprise to be predicted. The information data of the enterprise to be predicted is input into the shell recognition model, and the shell recognition model is predicted by preset rules according to the problem types identified. The application also provides a risk identification system. Through the risk identification method and system provided in this application, the accuracy of training model can be increased, and data analysis can be carried out more comprehensively when judging whether an enterprise is a shell enterprise or not, so as to improve the accuracy of data judgment.
【技术实现步骤摘要】
一种风险识别方法和系统
本申请属于数据处理
,具体涉及一种风险识别方法和风险识别系统。
技术介绍
企业在生产经营过程中,需要通过金融市场的金融工具实现资金的筹备等,而,企业空壳会对金融市场造成严重的损失,金融企业通过建立风险模型并通过风险模型对企业经营风险进行预测,以使得金融企业保持投资回报。在企业经营过程中,每个企业每天都在发生着改变,这些改变有可能使得企业越来越好,也有可能使得企业面临各种风险。面对企业的千万级数据,从中分析出企业的风险信息对企业运营的决策和投资者都是比较好的参考。目前已有的企业经营风险预测方法主要包括于统计学的方法和基于机器学习的方法。目前,现有的企业风险预测评估方法不完善,而且在风险模型的建立过程中数据处理量过大,对服务器造成巨大压力,且数据处理速度过慢。因此,亟待一种企业风险识别能够结合企业的各种资产、财务数据、经营数据、债务相关数据,迅速建立模型并将该模型应用到预测数据中,从不同维度对企业风险进行预测。
技术实现思路
为了解决现有技术存在的上述问题,本申请目的在于提供一种风险识别方法和系统,旨在解决现有预测模型对内存消耗过大,存在大量不必要的数据计算的问题。为解决上述技术问题,本申请提供了一种风险识别方法,用于对企业空壳风险进行识别,所述方法包括:获取企业空壳样本集;通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;获取待预测企业的信息数据;将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。可选地, ...
【技术保护点】
1.一种风险识别方法,其特征在于,用于对企业空壳风险进行识别,所述方法包括:获取企业空壳样本集;通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;获取待预测企业的信息数据;将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。
【技术特征摘要】
1.一种风险识别方法,其特征在于,用于对企业空壳风险进行识别,所述方法包括:获取企业空壳样本集;通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;获取待预测企业的信息数据;将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。2.如权利要求1所述的风险识别方法,其特征在于,通过smote算法对所述企业空壳样本集进行过采样。3.如权利要求2所述的风险识别方法,其特征在于,经过所述过采样的企业空壳样本集包括空壳企业和非空壳企业,其中,所述空壳企业与非空壳企业的数量比为1:2。4.如权利要求1所述的风险识别方法,其特征在于,所述根据待识别的空壳问题类型以预设规则通过所述空壳识别模型进行预测的步骤,包括:确定所述待识别的空壳问题类型为分类问题,则根据所述至少两个决策树模型的分类结果进行投票,根据投票结果确定最终分类结果;确定所述待识别的空壳问题类型为回归问题,则根据所述至少两个决策树模型的预测值的均值确定最终预测结果。5.如权利要求1所述的风险识别方法,其特征在于,所述通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型的步骤,包括:根据bootstraping算法从所述企业空壳样本集中生成至少两个训练集;所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型。6.如权利要求5所述的风险识别方法,其特征在于,所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型的步骤,包括:对所述至少两个训练集进行标准化;通过对标准化后的数据进行清洗和选择分别得到所...
【专利技术属性】
技术研发人员:陈玮,刘德彬,黄远江,严开,陈长沙,
申请(专利权)人:重庆誉存大数据科技有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。