一种风险识别方法和系统技术方案

技术编号:20919221 阅读:14 留言:0更新日期:2019-04-20 10:15
本申请提供了一种风险识别方法,应用于终端,用于对企业破产风险进行识别,方法包括:获取待预测企业的信息数据;根据构建的风险识别模型对待预测企业的信息数据进行分析处理以得到预测结果,其中,构建的风险识别模型为依据lightGBM机器学习算法训练建立;将预测结果以预设的可视化方式显示于终端的显示界面,以供用户可以清楚地获知预测结果。本申请还提供了一种风险识别系统。通过本申请提供的风险识别方法和系统,可以减少数据标准化流程,提升模型建立速度,并且在进行建树过程中,可以降低更多的误差,得到更好的精度。同时,在风险识别模型学习过程中采用多种不同类型企业信息数据,使得建立的模型更加的完善,以确保风险预测的准确性。

A Risk Identification Method and System

This application provides a method of risk identification, which is applied to the terminal to identify the bankruptcy risk of the enterprise. The methods include: obtaining the information data of the enterprise to be predicted; analyzing and processing the information data of the enterprise to be predicted according to the constructed risk identification model to obtain the prediction results. The constructed risk identification model is trained and constructed based on the lightGBM machine learning algorithm. The predicted results are displayed on the terminal's display interface in a preset visualization way, so that users can clearly know the predicted results. The application also provides a risk identification system. Through the risk identification method and system provided in this application, the data standardization process can be reduced, the speed of model building can be improved, and in the process of tree building, more errors can be reduced and better accuracy can be obtained. At the same time, in the process of learning risk identification model, different types of enterprise information data are used to make the established model more perfect to ensure the accuracy of risk prediction.

【技术实现步骤摘要】
一种风险识别方法和系统
本申请属于数据处理
,具体涉及一种风险识别方法和系统。
技术介绍
企业在生产经营过程中,需要通过金融市场的金融工具实现资金的筹备等,而,企业破产会对金融市场造成严重的损失,金融企业通过建立风险模型并通过风险模型对企业经营风险进行预测,以使得金融企业保持投资回报。在企业经营过程中,每个企业每天都在发生着改变,这些改变有可能使得企业越来越好,也有可能使得企业面临各种风险。面对企业的千万级数据,从中分析出企业的风险信息对企业运营的决策和投资者都是比较好的参考。目前已有的企业经营风险预测方法主要包括于统计学的方法和基于机器学习的方法。目前,现有的企业风险预测评估方法不完善,而且在风险模型的建立过程中数据处理量过大,对服务器造成巨大压力,且数据处理速度过慢。因此,亟待一种企业风险识别能够结合企业的各种资产、财务数据、经营数据、债务相关数据,迅速建立模型并将该模型应用到预测数据中,从不同维度对企业风险进行预测。
技术实现思路
为了解决现有技术存在的上述问题,本申请目的在于提供一种风险识别方法和系统,旨在解决现有预测模型对内存消耗过大,存在大量不必要的数据计算的问题。为解决上述技术问题,本申请提供了一种风险识别方法,应用于终端,用于对企业破产风险进行识别,所述方法包括:获取待预测企业的信息数据;根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立;将所述预测结果以预设的可视化方式显示于所述终端的显示界面,以供用户可以清楚地获知预测结果。可选地,所述方法还包括:获取所述风险识别模型的原始训练数据;利用所述lightGBM机器学习算法对所述原始训练数据进行学习,以得到所述风险识别模型。可选地,所述利用所述lightGBM机器学习算法对所述原始训练数据进行学习,以得到所述风险识别模型的步骤,包括:将所述原始训练数据进行数值处理以得到连续的特征值数据;对所述连续的特征值数据进行离散处理以得到直方图;根据所述直方图生成所述风险识别模型。可选地,所述原始训练数据包括已知破产企业数据信息和非破产企业数据信息,其中,所述已知破产企业与所述非破产企业的数量比为1:1.4。可选地,所述已知破产企业数据信息和非破产企业数据信息包括但不限于:工商信息、行政处罚、开庭公告、裁判文书、招投标、司法拍卖、商标注册、失信被执行、专利和判决执行。可选地,所述直方图中包括的类别包括:注册资本(量级万)、成立年限、行业企业数量、行业企业吊销率、关联公司裁判文书被告次数、裁判文书次数、法人变更次数、商标注册数量、是否吊销、失信次数、裁判文书被告案件判决总金额、网络图法人对外投资或者任职的公司执行次数、裁判文书被告与破产有关纠纷次数、行业企业吊销数量、股东变更次数、网络图股东或者对外投资企业的执行次数、裁判文书被告合同纠纷次数、法院公告与否、网络图股东或者对外投资企业作为被告的裁判文书次数、地址变更次数。可选地,所述根据所述直方图生成所述风险识别模型的步骤,包括:遍历所述直方图确定类别以及对应的统计量;根据所述统计量确定满足预设条件的类别为最优分割点;以梯度提升树和所述最优分割点建立决策树以形成所述风险识别模型。可选地,所述决策树的建树过程中采用带深度限制的Leaf-wise的叶子生长策略。可选地,所述决策树的叶子所对应的直方图通过所述叶子的父节点的直方图与所述叶子的兄弟节点的直方图做差得到。本申请还提供了一种风险识别系统,所述风险识别系统用于对企业破产风险进行识别,所述系统包括:数据获取模块,用于获取待预测企业的信息数据;数据分析模块,用于根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立;显示模块,用于将所述预测结果以预设的可视化方式显示于所述终端的显示界面,以供用户可以清楚地获知预测结果。本申请通过从现有的企业信息数据中,通过lightGBM机器学习算法对企业信息数据中的各个方面的数据特征进行学习,通过直方图的方式可以使用类别型数据,减少了数据标准化流程,同时,通过此种方式建立的决策树的叶子的直方图可以由它的父亲节点的直方图与它兄弟节点的直方图做差得到,提升一倍速度。并且在进行建树过程中,采用带有深度限制的按叶子生长(leaf-wise)算法,Leaf-wise是一种更为高效的策略,每次从当前所有叶子中,找到分裂增益最大的一个叶子,然后分裂并循环,在分裂次数相同的情况下,Leaf-wise可以降低更多的误差,得到更好的精度。同时,在风险识别模型学习过程中采用多种不同类型企业信息数据,使得建立的模型更加的完善,以确保风险预测的准确性。附图说明图1为本申请流程图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。图1是本申请提供的一风险识别方法的流程图。该实施例的方法一旦被用户触发,则该实施例中的流程通过终端自动运行,其中,各个步骤在运行的时候可以是按照如流程图中的顺序先后进行,也可以是根据实际情况多个步骤同时进行,在此并不做限定。本申请提供的风险识别方法用于对企业破产风险进行识别。本申请提供的信息提示方法包括如下步骤:步骤S110,获取待预测企业的信息数据;步骤S120,根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立;步骤S130,将所述预测结果以预设的可视化方式显示于所述终端的显示界面,以供用户可以清楚地获知预测结果。通过本申请提供的风险识别方法,通过lightGBM可以降低数据学习过程的数据处理程序,同时,可以降低更多的误差,得到更好精度决策树。同时,在风险识别模型学习过程中采用多种不同类型企业信息数据,使得建立的模型更加的完善,以确保风险预测的准确性。下面将结合具体实施例对上述各步骤进行详细的叙述。在步骤S110中,获取待预测企业的信息数据。在本实施方式中,待预测企业是指待评估其经营风险的企业。信息数据包括但不限于工商信息、行政处罚、开庭公告、裁判文书、招投标、司法拍卖、商标注册、失信被执行、专利、执行等企业正面和负面的信息。具体地,在本实施方式中,可以通过网络爬虫的方式,预先设定待预测企业的基本信息,然后通过网络爬虫自动从网上获取与该预测企业相关的信息信息数据。在其他实施方式中,也可以是待预测企业主动将与其相关的数据提供给使用本申请提供的风险识别方法的使用者,使用者利用待预测企业提供的信息数据通过下述步骤完成风险识别预测。在步骤S120中,根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立。具体地,风险识别模型是通过ligh本文档来自技高网...

【技术保护点】
1.一种风险识别方法,其特征在于,应用于终端,用于对企业破产风险进行识别,所述方法包括:获取待预测企业的信息数据;根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立;将所述预测结果以预设的可视化方式显示于所述终端的显示界面,以供用户可以清楚地获知预测结果。

【技术特征摘要】
1.一种风险识别方法,其特征在于,应用于终端,用于对企业破产风险进行识别,所述方法包括:获取待预测企业的信息数据;根据构建的风险识别模型对所述待预测企业的信息数据进行分析处理以得到预测结果,其中,所述构建的风险识别模型为依据lightGBM机器学习算法训练建立;将所述预测结果以预设的可视化方式显示于所述终端的显示界面,以供用户可以清楚地获知预测结果。2.如权利要求1所述的风险识别方法,其特征在于,所述方法还包括:获取所述风险识别模型的原始训练数据;利用所述lightGBM机器学习算法对所述原始训练数据进行学习,以得到所述风险识别模型。3.如权利要求2所述的风险识别方法,其特征在于,所述利用所述lightGBM机器学习算法对所述原始训练数据进行学习,以得到所述风险识别模型的步骤,包括:将所述原始训练数据进行数值处理以得到连续的特征值数据;对所述连续的特征值数据进行离散处理以得到直方图;根据所述直方图生成所述风险识别模型。4.如权利要求2所述的风险识别方法,其特征在于,所述原始训练数据包括已知破产企业数据信息和非破产企业数据信息,其中,所述已知破产企业与所述非破产企业的数量比为1:1.4。5.如权利要求4所述的风险识别方法,其特征在于,所述已知破产企业数据信息和非破产企业数据信息包括但不限于:工商信息、行政处罚、开庭公告、裁判文书、招投标、司法拍卖、商标注册、失信被执行、专利和判决执行。6.如权利要求3所述的风险识别方法,其特征在于,所述直方图中包括的类别包括:注册资本(量级万)、成立年限、行业...

【专利技术属性】
技术研发人员:刘德彬陈玮黄远江严开陈长沙
申请(专利权)人:重庆誉存大数据科技有限公司
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1