The application belongs to the field of big data analysis, and discloses a calculation method, device and computer equipment of risk probability. This application obtains the fragmented data on the network of enterprises and associated enterprises. The data dimension is rich, and various preprocessing projects are carried out. Then, the infectious disease model is used to analyze and transform the risk transmission in the association relationship of enterprises, and the association risk of enterprises is reflected in a numerical way. Finally, the multi-layer model fusion method is used The accuracy of the model is improved.
【技术实现步骤摘要】
风险概率的计算方法、装置和计算机设备
本申请涉及到大数据分析领域,特别是涉及到一种风险概率的计算方法、装置和计算机设备。
技术介绍
目前市面上的企业违约模型的构建使用的数据维度较少,模型构建简单,并且没有关注主体监控企业的关联风险;基于以上原因,企业债务风险模型的正确率不足以达到业务运用要求。
技术实现思路
本申请的主要目的为提供一种风险概率的计算方法、装置和计算机设备,旨在解决现有技术中企业债务违约风险预测准确率低的问题。为了实现上述专利技术目的,本申请提出一种风险概率的计算方法,包括:获取待预测的企业的企业信息;依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算 ...
【技术保护点】
1.一种风险概率的计算方法,其特征在于,包括:/n获取待预测的企业的企业信息;/n依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;/n根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;/n将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;/n将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;/n将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;/n将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。/n
【技术特征摘要】
1.一种风险概率的计算方法,其特征在于,包括:
获取待预测的企业的企业信息;
依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;
根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;
将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;
将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;
将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;
将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。
2.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤,包括:
使用xgboosting算法对所述第三数据矩阵进行预建模,以对所述第三数据矩阵中的各数据特征维度的权重进行排序;
抽取指定排名之前的数据特征维度作为后续模型训练的输入参数;
将所述输入参数分别输入到多个预设的基准模型中进行计算,并以boosting的方式进行融合得到所述企业的债务违约风险概率值。
3.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合的步骤,包括:
使用预设的分词模型对第一组碎片化信息进行分词处理,得到第一组分词集合,以及使用所述分词模型对各第二组碎片化信息进行分词处理,得到与各第二组碎片化信息对应的第二组分词集合;
使用预设的词向量模型,将第一组分词集合中的各分词进行向量化,得到第一组向量化数据,以及使用所述词向量模型,将各第二组分词集合中的各分词进行向量化,得到与各第二组碎片化信息对应的多组第二组向量化数据;
对第一组向量化数据进行降维处理,得到第一组碎片化信息的第一向量化表示,以及对各第二组向量化数据进行降维处理,得到各第二组碎片化信息的第二向量化表示;
利用预设的分类模型分别对第一向量化表示和各第二向量化表示进行分类,到所述第一组分类信息集合和各所述第二组分类信息集合。
4.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤之后,包括:
判断所述企业的债务违约风险概率值是否大于预设的风险概率阈值;
若是,则生成可视化报警信息。
5.根据权利要求1所述的风险概率的计算方法,其特征在于,所述根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息...
【专利技术属性】
技术研发人员:车驰,秦鹏,权佳成,张瑜,谭瑞,
申请(专利权)人:重庆金融资产交易所有限责任公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。