一种基于超图对比学习的金融违约风险预测方法技术

技术编号：38400348 阅读：6 留言：0更新日期：2023-08-07 11:12

本发明专利技术涉及金融违约预测技术领域，且公开了一种基于超图对比学习的金融违约风险预测方法，包括以下步骤：步骤1，获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系；步骤2，生成企业初始特征矩阵和负样本特征矩阵，构建超图，根据超图点边关联矩阵得到超图拉普拉斯矩阵；步骤3，应用超图卷积网络，得到企业表征矩阵和负样本表征矩阵；步骤4，生成全图表征向量，基于对比损失和分类损失进行联合训练，完成对企业违约风险的预测。本发明专利技术采用上述基于超图对比学习的金融违约风险预测方法，能够减少信息的丢失，提高金融违约风险的预测效果。的预测效果。的预测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于超图对比学习的金融违约风险预测方法

[0001]本专利技术涉及金融违约预测
，尤其是涉及一种基于超图对比学习的金融违约风险预测方法。

技术介绍

[0002]我国资本市场的融资功能不断完备，发行债券逐渐成为企业融资的重要渠道，投资人数量逐渐增加，债券市场在金融市场中的地位日益重要。信用是金融市场有序运转和经济稳健发展的重要基础，也是信用债的发行基础。及时预测发债企业的信用违约风险显得尤为重要。
[0003]企业的违约风险预测问题中，通常将企业分为两类，一类为违约状态，一类为非违约状态，即是二分类问题。现有的风险预测方法可以大致分为基于统计的方法和基于机器学习的方法。与其他分类问题相比，在风险预测场景中，最重要的违约样本在全体样本中所占比例较小，相对于准确率，代表着正确预测出违约样本占比的召回率更值得关注。
[0004]经典的基于统计的方法大多应用逻辑回归方法，通过企业的财务指标数据构建逻辑回归模型预测企业的违约概率。逻辑回归模型在信用风险评估过程中，不仅可以判断企业属于哪一种状态，还可以对企业出现违约情况的概率进行评估。以逻辑回归为代表的统计学方法以财务指标数据分析为主，对违约风险的预测准确率不足。预测模型适用的数据必须服从一定的分布，并且变量之间需要存在线性相关关系。企业财务数据直接由于情景变量和风险因素存在非线性关系，随着机器学习的逐渐发展与债券市场数据规模的急速扩大、数据形式的多样化，早期的基于统计的方法在违约风险预测的适用性上已出现不足。
[0005]基于机器学习的方法主要...

【技术保护点】

【技术特征摘要】
1.一种基于超图对比学习的金融违约风险预测方法，其特征在于：包括以下步骤：步骤1，获取发债企业的基本数据、是否违约情况和发债企业之间的关联关系；步骤2，根据发债企业基本数据生成企业初始特征矩阵和负样本特征矩阵，根据发债企业间关联关系，构建超图，得到超图点边关联矩阵，计算超图节点度矩阵和超边度矩阵，得到超图拉普拉斯矩阵；步骤3，基于超图拉普拉斯矩阵，将企业初始特征矩阵和负样本特征矩阵输入超图卷积网络层，得到企业表征矩阵和负样本表征矩阵；步骤4，基于企业表征矩阵生成全图表征向量，基于对比损失和分类损失进行联合训练，完成对企业违约风险的预测。2.根据权利要求1所述的基于超图对比学习的金融违约风险预测方法，其特征在于：步骤1中，发债企业主体为在债券市场发行过债券的主体，发债企业基本数据包括企业的工商信息及财务报表信息，发债企业关联关系包括企业间的股东关系、对外投资关系、控股关系、上游供应商关系和下游客户关系。3.根据权利要求2所述的基于超图对比学习的金融违约风险预测方法，其特征在于：步骤2中：步骤21，根据发债企业间关联关系，构建以发债企业作为节点，关联关系作为超边的超图；步骤22，根据发债企业的基础数据及超图数据，对发债企业数据集合中的数据进行ID编号，对超图中的超边进行ID编号，初始化超图点边关联矩阵并根据超边数据对初始化矩阵进行填充，得到超图点边关联矩阵H；步骤23，根据发债企业基础数据生成企业初始特征矩阵X和负样本特征矩阵步骤24，根据超图点边关联矩阵H计算节点度矩阵D
v
和超边度矩阵D
e
，并得到超图拉普拉斯矩阵L。4.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法，其特征在于：步骤22中：步骤221，初始化一个维度为企业数量*超边数量的初始超图点边关联矩阵；步骤222，对初始超图点边关联矩阵进行填充，将具有ID编号的企业数据和具有ID编号的超边数据作为初始化矩阵的行标和列标；若具有ID编号为i的企业存在于具有ID编号为j的超边中，则在初始化矩阵的第i行第j列位置的值为第一参数，否则为第二参数，公式如下：其中，v代表节点，e代表超边。5.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法，其特征在于：步骤23中：步骤231，对发债企业基础数据中数值型数据进行归一化作为特征，时间数据转换为时间戳后进行归一化作为特征，非数值型数据按照出现频率进行编码转换为数值后进行归一化作为特征；
步骤232，生成维度为发债企业数量*总特征数量的企业初始特征矩阵X，其中第i行第j列为ID为i的企业的第j维特征；步骤233，随机扰乱初始特征矩阵X的行号顺序，得到负样本特征矩阵6.根据权利要求3所述的基于超图对比学习的金融违约风险预测方法，其特征在于：步骤24中：步骤241，分别对节点度矩阵D
v
和超边度矩阵D
e
进行初始化，且D
v
的维度与超图点边关联矩阵H的行数相同，D
e
的维度与超图点边关联矩阵H的列数相同；步骤242，分别对超图点边关联矩阵H中每行的数值进行相加，获得多个行向量，将多个行向量依次添加到初始化后的D
v
中，实现对D
v
的计算；步骤243，分别对超图点边关联矩阵H中每列的数值进行相加，获得多个列向量，将多个列向量依次添加到初始化后的D<...

【专利技术属性】
技术研发人员：卢茜君，李荣华，秦宏超，王国仁，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人