风险概率的计算方法、装置和计算机设备制造方法及图纸

技术编号:22565823 阅读:25 留言:0更新日期:2019-11-16 12:20
本申请属于大数据分析领域,揭示了一种风险概率的计算方法、装置和计算机设备。本申请通过获取到企业以及与企业关联的关联企业的网络上的碎片化数据,得到的数据维度丰富,并进行了数据的多种预处理工程,然后使用传染病模型对企业关联关系中的风险传导进行分析转换,以数值化的方式体现企业的关联风险,最后使用多层模型融合的方式,提高了预测企业债务违约风险模型的预测正确率。

Calculation method, device and computer equipment of risk probability

The application belongs to the field of big data analysis, and discloses a calculation method, device and computer equipment of risk probability. This application obtains the fragmented data on the network of enterprises and associated enterprises. The data dimension is rich, and various preprocessing projects are carried out. Then, the infectious disease model is used to analyze and transform the risk transmission in the association relationship of enterprises, and the association risk of enterprises is reflected in a numerical way. Finally, the multi-layer model fusion method is used The accuracy of the model is improved.

【技术实现步骤摘要】
风险概率的计算方法、装置和计算机设备
本申请涉及到大数据分析领域,特别是涉及到一种风险概率的计算方法、装置和计算机设备。
技术介绍
目前市面上的企业违约模型的构建使用的数据维度较少,模型构建简单,并且没有关注主体监控企业的关联风险;基于以上原因,企业债务风险模型的正确率不足以达到业务运用要求。
技术实现思路
本申请的主要目的为提供一种风险概率的计算方法、装置和计算机设备,旨在解决现有技术中企业债务违约风险预测准确率低的问题。为了实现上述专利技术目的,本申请提出一种风险概率的计算方法,包括:获取待预测的企业的企业信息;依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。进一步地,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤,包括:使用xgboosting算法对所述第三数据矩阵进行预建模,以对所述第三数据矩阵中的各数据特征维度的权重进行排序;抽取指定排名之前的数据特征维度作为后续模型训练的输入参数;将所述输入参数分别输入到多个预设的基准模型中进行计算,并以boosting的方式进行融合得到所述企业的债务违约风险概率值。进一步地,所述将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合的步骤,包括:使用预设的分词模型对第一组碎片化信息进行分词处理,得到第一组分词集合,以及使用所述分词模型对各第二组碎片化信息进行分词处理,得到与各第二组碎片化信息对应的第二组分词集合;使用预设的词向量模型,将第一组分词集合中的各分词进行向量化,得到第一组向量化数据,以及使用所述词向量模型,将各第二组分词集合中的各分词进行向量化,得到与各第二组碎片化信息对应的多组第二组向量化数据;对第一组向量化数据进行降维处理,得到第一组碎片化信息的第一向量化表示,以及对各第二组向量化数据进行降维处理,得到各第二组碎片化信息的第二向量化表示;利用预设的分类模型分别对第一向量化表示和各第二向量化表示进行分类,到所述第一组分类信息集合和各所述第二组分类信息集合。进一步地,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤之后,包括:判断所述企业的债务违约风险概率值是否大于预设的风险概率阈值;若是,则生成可视化报警信息。进一步地,所述根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息的步骤,包括:以所述企业的名称和/或企业股东为关键字全网检索得到所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业的名称和/或企业股东为关键字全网检索得到各所述关联企业的碎片化信息,得到多组第二组碎片化信息。进一步地,所述以所述企业的名称和/或企业股东为关键字全网检索得到所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业的名称和/或企业股东为关键字全网检索得到各所述关联企业的碎片化信息,得到多组第二组碎片化信息的步骤,包括:以所述企业的名称和/或企业股东为关键字全网检索得到所述企业的碎片化信息,当所述企业的碎片化信息中存在新闻类信息时,选择指定时间跨度内的新闻信息加入到所述第一组碎片化信息中;以及,以所述关联企业的名称和/或企业股东为关键字全网检索得到所述关联企业的碎片化信息,当所述关联企业的碎片化信息中存在新闻类信息时,选择指定时间跨度内的新闻信息加入到所述第二组碎片化信息中。本申请还提供一种风险概率的计算装置,包括:第一获取单元,用于获取待预测的企业的企业信息;第二获取单元,用于依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;第三获取单元,用于根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;分类单元,用于将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;数字化单元,用于将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;融合单元,用于将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;计算单元,用于将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。进一步地,所述计算单元,包括:排序模块,用于使用xgboosting算法对所述第三数据矩阵进行预建模,以对所述第三数据矩阵中的各数据特征维度的权重进行排序;抽取模块,用于抽取指定排名之前的数据特征维度作为后续模型训练的输入参数;计算模块,用于将所述输入参数分别输入到多个预设的基准模型中进行计算,并以boosting的方式进行融合得到所述企业的债务违约风险概率值。本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现申述任一项所述方法的步骤。本申请还提供一种种计算机可读存储介质,其上存储有计算机程序,,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。本申请的风险概率的计算方法、装置和计算机设备,获取到企业以及与企业关联的关联企业的网络上的碎片化数据,得到的数据维度丰富,并进行了数据的多种预处理工程,然后使用传染病模型对企业关联关系中的风险传导进行分析转换,以数值化的方式体现企业的关联风险,最后使用多层模型融合的方式,提高了预测企业债务违约风险模型的预测正确率。本文档来自技高网...

【技术保护点】
1.一种风险概率的计算方法,其特征在于,包括:/n获取待预测的企业的企业信息;/n依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;/n根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;/n将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;/n将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;/n将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;/n将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。/n

【技术特征摘要】
1.一种风险概率的计算方法,其特征在于,包括:
获取待预测的企业的企业信息;
依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;
根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;
将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;
将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;
将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;
将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。


2.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤,包括:
使用xgboosting算法对所述第三数据矩阵进行预建模,以对所述第三数据矩阵中的各数据特征维度的权重进行排序;
抽取指定排名之前的数据特征维度作为后续模型训练的输入参数;
将所述输入参数分别输入到多个预设的基准模型中进行计算,并以boosting的方式进行融合得到所述企业的债务违约风险概率值。


3.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合的步骤,包括:
使用预设的分词模型对第一组碎片化信息进行分词处理,得到第一组分词集合,以及使用所述分词模型对各第二组碎片化信息进行分词处理,得到与各第二组碎片化信息对应的第二组分词集合;
使用预设的词向量模型,将第一组分词集合中的各分词进行向量化,得到第一组向量化数据,以及使用所述词向量模型,将各第二组分词集合中的各分词进行向量化,得到与各第二组碎片化信息对应的多组第二组向量化数据;
对第一组向量化数据进行降维处理,得到第一组碎片化信息的第一向量化表示,以及对各第二组向量化数据进行降维处理,得到各第二组碎片化信息的第二向量化表示;
利用预设的分类模型分别对第一向量化表示和各第二向量化表示进行分类,到所述第一组分类信息集合和各所述第二组分类信息集合。


4.根据权利要求1所述的风险概率的计算方法,其特征在于,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤之后,包括:
判断所述企业的债务违约风险概率值是否大于预设的风险概率阈值;
若是,则生成可视化报警信息。


5.根据权利要求1所述的风险概率的计算方法,其特征在于,所述根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息...

【专利技术属性】
技术研发人员:车驰秦鹏权佳成张瑜谭瑞
申请(专利权)人:重庆金融资产交易所有限责任公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1