【技术实现步骤摘要】
基于机器学习算法的违约预测方法、装置、设备及介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种基于机器学习算法的违约预测方法、装置、设备及介质。
技术介绍
[0002]近年来债券违约呈现逐年增加趋势,而企业的违约往往给投资企业带来巨大的损失。如果投资企业能够提前预知债券违约风险,就可以通过金融市场提前转移风险,将损失降低至最小。
[0003]目前市场上的预知债券违约风险的方式,主要的有两种,一种是参考信用评级公司的对企业的评级信息,该方法尽管评估的信息比较全面,但是专家经验的成分比较大,更新频率比较低(一般断则一个月评价一次,长的几年评价一次),风险评估周期比较长,无法实时评估企业风险;另一种是通过债券违约预警模型,目前市场上的预警模型大部分使用的是与企业相关联的负面信息来创建预警模型,从而导致模型的预测不够准确。因此,如何更有效、准确地预测违约风险成为一项重要议题。
技术实现思路
[0004]本专利技术实施例提供了一种基于机器学习算法的违约预测方法、装置、设备及介质,可以更精准地预测违约概率 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习算法的违约预测方法,其特征在于,包括:获取发债主体的舆情信息和经营数据信息,所述舆情信息包括正面信息、负面信息、中性信息中的一种或多种,所述舆情信息是指与所述发债主体相关的信息;对所述舆情信息和所述经营数据信息进行结构化处理,得到所述舆情信息和所述经营数据信息对应的结构化数据;对所述舆情信息和所述经营数据信息对应的结构化数据进行分析,得到所述舆情信息和所述经营数据信息的影响概率值;对所述舆情信息和所述经营数据信息进行聚类,得到所述舆情信息和所述经营数据信息对应的类别;将所述舆情信息和所述经营数据信息的影响概率值以及聚类后的舆情信息和经营数据信息输入预训练的违约预测模型和改进的KMV模型,得到所述发债主体违约的概率值。2.根据权利要求1所述的方法,其特征在于,所述对所述舆情信息和所述经营数据信息进行结构化处理,得到所述舆情信息和所述经营数据信息对应的结构化数据,包括:从所述舆情信息和所述经营数据信息提取与所述舆情信息和所述经营数据信息对应的第一特征向量;将所述第一特征向量输入自然语言处理模型中,得到与所述舆情信息和所述经营数据信息对应的结构化数据。3.根据权利要求2所述的方法,其特征在于,所述对所述舆情信息和所述经营数据信息对应的结构化数据进行分析,得到所述舆情信息和所述经营数据信息的影响概率值,包括:根据OCR识别技术从所述结构化数据中提取与预设的关键词对应的关键文本信息;通过情感分析技术对所述关键文本信息进行分析,得到所述舆情信息和所述经营数据信息的影响概率值。4.根据权利要求3所述的方法,其特征在于,所述通过情感分析技术对所述关键文本信息进行分析,得到所述舆情信息和所述经营数据信息的影响概率值,包括:对所述关键文本信息进行分词处理,得到所述关键文本信息对应的词序列;计算所述词序列中每个词的词向量,并根据所述每个词的词向量确定所述关键文本信息对应的文本向量;将所述文本向量输入预训练的情感分析模型中,得到所述关键文本信息的语义特征,并将所述语义特征输入指定分类器中,得到所述关键文本信息的情感分类的预测概率;根据所述情感分类的预测概率确定所述舆情信息和所述经营数据信息的影响概率值。5.根据权利要求1所述的方法,其特征在于,所述将所述舆情信息和所述经营数据信息的影响概率值以及聚类后的舆情信息和经营数据信息输入预训练的违约预测模型和改进的KMV模型,得到所述发债主体违约的概率值,包括:将所述舆情信息和所述经营数据信息的影响概率值以及聚类后的舆情信息和经营数据信息输入预训练的违约预测模型,得到违约特征信息;将所述违约特征信息输入改进的KMV模型,通过所述改进的...
【专利技术属性】
技术研发人员:杨宇宽,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。