一种基于超图对比学习的金融违约风险预测方法技术

技术编号:38400348 阅读:6 留言:0更新日期:2023-08-07 11:12
本发明专利技术涉及金融违约预测技术领域,且公开了一种基于超图对比学习的金融违约风险预测方法,包括以下步骤:步骤1,获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系;步骤2,生成企业初始特征矩阵和负样本特征矩阵,构建超图,根据超图点边关联矩阵得到超图拉普拉斯矩阵;步骤3,应用超图卷积网络,得到企业表征矩阵和负样本表征矩阵;步骤4,生成全图表征向量,基于对比损失和分类损失进行联合训练,完成对企业违约风险的预测。本发明专利技术采用上述基于超图对比学习的金融违约风险预测方法,能够减少信息的丢失,提高金融违约风险的预测效果。的预测效果。的预测效果。

【技术实现步骤摘要】
一种基于超图对比学习的金融违约风险预测方法


[0001]本专利技术涉及金融违约预测
,尤其是涉及一种基于超图对比学习的金融违约风险预测方法。

技术介绍

[0002]我国资本市场的融资功能不断完备,发行债券逐渐成为企业融资的重要渠道,投资人数量逐渐增加,债券市场在金融市场中的地位日益重要。信用是金融市场有序运转和经济稳健发展的重要基础,也是信用债的发行基础。及时预测发债企业的信用违约风险显得尤为重要。
[0003]企业的违约风险预测问题中,通常将企业分为两类,一类为违约状态,一类为非违约状态,即是二分类问题。现有的风险预测方法可以大致分为基于统计的方法和基于机器学习的方法。与其他分类问题相比,在风险预测场景中,最重要的违约样本在全体样本中所占比例较小,相对于准确率,代表着正确预测出违约样本占比的召回率更值得关注。
[0004]经典的基于统计的方法大多应用逻辑回归方法,通过企业的财务指标数据构建逻辑回归模型预测企业的违约概率。逻辑回归模型在信用风险评估过程中,不仅可以判断企业属于哪一种状态,还可以对企业出现违约情况的概率进行评估。以逻辑回归为代表的统计学方法以财务指标数据分析为主,对违约风险的预测准确率不足。预测模型适用的数据必须服从一定的分布,并且变量之间需要存在线性相关关系。企业财务数据直接由于情景变量和风险因素存在非线性关系,随着机器学习的逐渐发展与债券市场数据规模的急速扩大、数据形式的多样化,早期的基于统计的方法在违约风险预测的适用性上已出现不足。
[0005]基于机器学习的方法主要包括支持向量机、随机森林和神经网络。其中支持向量机的准确率较高但难以处理大规模数据,随机森林由多个决策树组成,能够处理大样本的高维数据,但在大规模数据集上的效果表现不如神经网络。数据规模与数据形式的变化使得基于神经网络的方法得到了较为长足的发展。越来越多的研究者试图引入形式更加多样的非企业财务数据,应用神经网络模型学习多种数据间的非线性关系,进而实现更为精准的预测。一些工作取得了很好的效果。BP神经网络模型和基于MLP的神经网络模型首先被引入违约风险预测领域,对发债企业进行信用风险的评估。但是普通的神经网络模型只能处理非欧数据,不能对现实世界中市场主体间复杂的关系进行建模表示。
[0006]基于Transformer的风险预测方法采用构建复杂网络的方法,来描绘市场主体之间的关系。利用企业的股东关系构建复杂网络,利用Transformer模型将复杂网络嵌入到特征空间得到企业向量表示。最后将企业向量表示输入到深度神经网络进行违约风险预测。但基于Transformer的方法难以处理相对稀疏的网络结构,并且很难准确描述市场主体间形成的高维关系信息。
[0007]综上,现有的金融违约风险预测方法主要存在以下的不足:
[0008](1)传统的统计学方法要求数据服从一定的分布,且变量间存在线性关系。
[0009](2)支持向量机难以用于大规模数据集,而随机森林的方法在大量数据上的性能
较低,并且都需要对特征进行预处理,无法重复利用日益丰富的数据形式。
[0010](3)普通神经网络在大规模数据上泛用能力强,但不具备处理非欧数据的能力,Transformer能够处理图结构的非欧数据,但不足以准确描述金融市场主体间的多元高维关系。
[0011]因此,如何充分利用规模庞大、结构复杂、种类多样的数据进行违约风险预测,并且尽可能地提高预测的准确率和召回率,成为当前研究的关键问题。

技术实现思路

[0012]本专利技术的目的是提供一种基于超图对比学习的金融违约风险预测方法,解决上述
技术介绍
中提出的问题。
[0013]为实现上述目的,本专利技术提供了一种基于超图对比学习的金融违约风险预测方法,包括以下步骤:
[0014]步骤1,获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系;
[0015]步骤2,根据发债企业基本数据生成企业初始特征矩阵和负样本特征矩阵,根据发债企业间关联关系,构建超图,得到超图点边关联矩阵,计算超图节点度矩阵和超边度矩阵,得到超图拉普拉斯矩阵;
[0016]步骤3,基于超图拉普拉斯矩阵,将企业初始特征矩阵和负样本特征矩阵输入超图卷积网络层,得到企业表征矩阵和负样本表征矩阵;
[0017]步骤4,基于企业表征矩阵生成全图表征向量,基于对比损失和分类损失进行联合训练,完成对企业违约风险的预测。
[0018]优选的,步骤1中,发债企业主体为在债券市场发行过债券的主体,发债企业基本数据包括企业的工商信息及财务报表信息,发债企业关联关系包括企业间的股东关系、对外投资关系、控股关系、上游供应商关系和下游客户关系。
[0019]优选的,步骤2中:
[0020]步骤21,根据发债企业间关联关系,构建以发债企业作为节点,关联关系作为超边的超图;
[0021]步骤22,根据发债企业的基础数据及超图数据,对发债企业数据集合中的数据进行ID编号,对超图中的超边进行ID编号,初始化超图点边关联矩阵并根据超边数据对初始化矩阵进行填充,得到超图点边关联矩阵H;
[0022]步骤23,根据发债企业基础数据生成企业初始特征矩阵X和负样本特征矩阵
[0023]步骤24,根据超图点边关联矩阵H计算节点度矩阵D
v
和超边度矩阵D
e
,并得到超图拉普拉斯矩阵L。
[0024]优选的,步骤22中:
[0025]步骤221,初始化一个维度为企业数量*超边数量的初始超图点边关联矩阵;
[0026]步骤222,对初始超图点边关联矩阵进行填充,将具有ID编号的企业数据和具有ID编号的超边数据作为初始化矩阵的行标和列标;若具有ID编号为i的企业存在于具有ID编号为j的超边中,则在初始化矩阵的第i行第j列位置的值为第一参数,否则为第二参数,公式如下:
[0027][0028]其中,v代表节点,e代表超边。
[0029]优选的,步骤23中:
[0030]步骤231,对发债企业基础数据中数值型数据进行归一化作为特征,时间数据转换为时间戳后进行归一化作为特征,非数值型数据按照出现频率进行编码转换为数值后进行归一化作为特征;
[0031]步骤232,生成维度为发债企业数量*总特征数量的企业初始特征矩阵X,其中第i行第j列为ID为i的企业的第j维特征;
[0032]步骤233,随机扰乱初始特征矩阵X的行号顺序,得到负样本特征矩阵
[0033]优选的,步骤24中:
[0034]步骤241,分别对节点度矩阵D
v
和超边度矩阵D
e
进行初始化,且D
v
的维度与超图点边关联矩阵H的行数相同,D
e
的维度与超图点边关联矩阵H的列数相同;
[0035]步骤242,分别对超图点边关联矩阵H中每行的数值进行相加,获得多个行向量,将多个行向量依次添加到初始化后的D
v<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超图对比学习的金融违约风险预测方法,其特征在于:包括以下步骤:步骤1,获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系;步骤2,根据发债企业基本数据生成企业初始特征矩阵和负样本特征矩阵,根据发债企业间关联关系,构建超图,得到超图点边关联矩阵,计算超图节点度矩阵和超边度矩阵,得到超图拉普拉斯矩阵;步骤3,基于超图拉普拉斯矩阵,将企业初始特征矩阵和负样本特征矩阵输入超图卷积网络层,得到企业表征矩阵和负样本表征矩阵;步骤4,基于企业表征矩阵生成全图表征向量,基于对比损失和分类损失进行联合训练,完成对企业违约风险的预测。2.根据权利要求1所述的基于超图对比学习的金融违约风险预测方法,其特征在于:步骤1中,发债企业主体为在债券市场发行过债券的主体,发债企业基本数据包括企业的工商信息及财务报表信息,发债企业关联关系包括企业间的股东关系、对外投资关系、控股关系、上游供应商关系和下游客户关系。3.根据权利要求2所述的基于超图对比学习的金融违约风险预测方法,其特征在于:步骤2中:步骤21,根据发债企业间关联关系,构建以发债企业作为节点,关联关系作为超边的超图;步骤22,根据发债企业的基础数据及超图数据,对发债企业数据集合中的数据进行ID编号,对超图中的超边进行ID编号,初始化超图点边关联矩阵并根据超边数据对初始化矩阵进行填充,得到超图点边关联矩阵H;步骤23,根据发债企业基础数据生成企业初始特征矩阵X和负样本特征矩阵步骤24,根据超图点边关联矩阵H计算节点度矩阵D
v
和超边度矩阵D
e
,并得到超图拉普拉斯矩阵L。4.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法,其特征在于:步骤22中:步骤221,初始化一个维度为企业数量*超边数量的初始超图点边关联矩阵;步骤222,对初始超图点边关联矩阵进行填充,将具有ID编号的企业数据和具有ID编号的超边数据作为初始化矩阵的行标和列标;若具有ID编号为i的企业存在于具有ID编号为j的超边中,则在初始化矩阵的第i行第j列位置的值为第一参数,否则为第二参数,公式如下:其中,v代表节点,e代表超边。5.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法,其特征在于:步骤23中:步骤231,对发债企业基础数据中数值型数据进行归一化作为特征,时间数据转换为时间戳后进行归一化作为特征,非数值型数据按照出现频率进行编码转换为数值后进行归一化作为特征;
步骤232,生成维度为发债企业数量*总特征数量的企业初始特征矩阵X,其中第i行第j列为ID为i的企业的第j维特征;步骤233,随机扰乱初始特征矩阵X的行号顺序,得到负样本特征矩阵6.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法,其特征在于:步骤24中:步骤241,分别对节点度矩阵D
v
和超边度矩阵D
e
进行初始化,且D
v
的维度与超图点边关联矩阵H的行数相同,D
e
的维度与超图点边关联矩阵H的列数相同;步骤242,分别对超图点边关联矩阵H中每行的数值进行相加,获得多个行向量,将多个行向量依次添加到初始化后的D
v
中,实现对D
v
的计算;步骤243,分别对超图点边关联矩阵H中每列的数值进行相加,获得多个列向量,将多个列向量依次添加到初始化后的D<...

【专利技术属性】
技术研发人员:卢茜君李荣华秦宏超王国仁
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1