一种基于表征学习的财务风险预测方法及系统技术方案

技术编号：38158528 阅读：15 留言：0更新日期：2023-07-13 09:28

本发明专利技术公开了一种基于表征学习的财务风险预测方法及系统，该方法包括：获取包含M个财务文本的财务文本集合；对每个财务文本进行向量化处理，获取对应的文本向量序列，并根据文本向量序列和财务文本表征模型，获取对应的文本特征向量；获取包含N个风险词条的风险词条集合；根据风险词条集合和财务文本表征模型，获取每个风险词条对应的词条特征向量；对于M个文本特征向量和N个词条特征向量，计算基于交叉注意力的余弦相似度，并构建相似度矩阵；将相似度矩阵拆分为列向量，根据列向量和财务风险预测模型，获取财务风险预测结果。本发明专利技术提高了财务风险预测的实时性、准确性和适用性，并且实现了自定义词条的任意财务风险预测的目的。的目的。的目的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于表征学习的财务风险预测方法及系统

[0001]本专利技术涉及机器学习与风险预测
，尤其涉及一种基于表征学习的财务风险预测方法及系统。

技术介绍

[0002]随着企业规模的增大，企业在财务活动过程中面临的企业财务风险挑战和压力日益增加。由于企业财务风险具有实时性、突发性等特点，需要在企业日常经营中加以重视，以避免造成企业经济损失。
[0003]企业财务活动过程中主要涉及资金管理、成本管理等方面。目的大部分企业仍通过人工核算大量相关财务文本识别财务状态，以对企业财务风险进行分析和预测。然而，财务文本的信息复杂多样，人工核算时效性差、效率低，容易导致企业无法准确有效地判断实时突发性财务风险，从而导致企业无法对即将发生的风险进行规避，造成企业经济利益损失。
[0004]现有技术中，虽然有部分基于深度学习的财务风险预警方法，例如专利文献CN112950004A提供了一种企业财务预警方法，该方法首先通过超长短期记忆神经网络模型对样本企业历史财务报表中的指标数据进行特征提取，输出特征用于训练预警模型，最后基于训练好的预警模型，以预评估企业财务信息的指标数据为输入，得到评估结果。该方法虽然可以解决人工核算方法存在的效性差、效率低的问题，但是采用财务表报中的指标数据进行财务风险预警，存在对财务文本的特征提取不够全面，财务风险预测结果不够准确的问题。此外，该方法通过预警模型进行风险预警，只能判断企业具有或者不具有财务风险，而无法预测企业的风险类型和风险程度，存在适用性差问题。
[0005]因此，如何...

【技术保护点】

【技术特征摘要】
1.一种基于表征学习的财务风险预测方法，其特征在于，包括：获取财务文本集合，所述财务文本集合包含M个财务文本；对每个所述财务文本进行向量化处理，获取对应的文本向量序列，并根据所述文本向量序列和预设的财务文本表征模型，获取对应的文本特征向量；获取风险词条集合，所述风险词条集合包含不同类型和不同程度的N个风险词条；根据所述风险词条集合和所述财务文本表征模型，获取与所述每个风险词条对应的词条特征向量；对于M个所述文本特征向量和N个所述词条特征向量，计算基于交叉注意力的余弦相似度，并构建相似度矩阵；将所述相似度矩阵拆分为列向量，根据所述列向量和预设的财务风险预测模型，获取财务风险预测结果。2.根据权利要求1所述的基于表征学习的财务风险预测方法，其特征在于，方法还包括：基于深度自注意力网络构建文本表征模型；根据至少一个财务文本、所述财务文本对应的财务风险类别标签以及文本向量序列，构建财务文本训练集；从所述文本向量序列中获取任意句子向量，并通过随机掩码算法得到掩码后的句子向量；将所述掩码后的句子向量输入所述文本表征模型，预测文本向量概率分布；根据所述文本向量概率分布和原句子向量，确定第一交叉熵损失函数，并采用梯度下降反向传播算法优化所述文本表征模型，以获得文本表征优化模型；根据不同类型或者不同程度的风险词条，构建风险词条训练集；将所述文本向量序列和所述风险词条输入所述文本表征优化模型，获取财务文本特征向量和词条特征向量；获取所述财务文本特征向量和所述词条特征向量之间的相关性，与所述财务文本的财务风险类别标签，确定第二交叉熵损失函数，并采用梯度下降反向传播算法优化所述文本表征优化模型，以获得财务文本表征模型。3.根据权利要求2所述的基于表征学习的财务风险预测方法，其特征在于，所述获取所述财务文本特征向量和所述词条特征向量之间的相关性，包括：根据所述财务文本特征向量和所述词条特征向量，计算交叉注意力向量；通过预设激活函数对所述交叉注意力向量进行处理，得到相关性；其中，所述相关性表示为：，上式中，为相关性集合；为Sigmoid激活函数；为词条特征向量；为文本特征向量；、为可学习向量；为第个词条特征向量与第个财务文本特征向量之间的相关性。4.根据权利要求3所述的基于表征学习的财务风险预测方法，其特征在于，所述第一交叉熵损失函数为：
，上式中，为第一交叉熵损失函数；为文本表征模型的网络参数；为文本向量概率分布；为文本向量概率分布中的文本向量；为文本向量的概率值；为向量标记，用于判断概率值对应的文本向量是否属于原句子向量；所述第二交叉熵损失函数为：，上式中，为第二交叉熵损失函数；为第个词条特征向量与第个财务文本特征向量之间的相关性；为相关性标注，用于预测第个风险词条与第个财务文本是否相关。5.根据权利要求1所述的基于表征学习的财务风险预测方法，其特征在于，所述对于M个文本特征向量和N个词条特征向量，计算基于交叉注意力的余弦相似度，并构建相似度矩阵，包括：获取基于交叉注意力的余弦相似度评估模型，具体为：，其中，为基于交叉注意力的余弦相似度评估模型；为词条特征向量；为文本特征向量；、为可学习向量；为矩阵转置操作；为向量取模函数...

【专利技术属性】
技术研发人员：胡为民，黄婵娟，何永定，余露，
申请(专利权)人：深圳市迪博企业风险管理技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人