基于机器学习的上市公司财务异常分析方法技术

技术编号:34387995 阅读:43 留言:0更新日期:2022-08-03 21:12
本发明专利技术公开了一种基于机器学习的上市公司财务异常分析方法,包括以下步骤:获取用于训练的财务数据和非财务数据,并对所述财务数据和所述非财务数据进行预处理,得到财务特征数据和非财务特征数据;根据所述财务特征数据构建衍生指标,并进行重要特征筛选,获取输入特征;基于所述非财务特征数据和所述输入特征训练财务异常分析模型,并基于训练后的所述财务异常分析模型对未知样本进行异常等级预测;获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法判断所述未知样本的财务异常类别,并进行指标分析。增强了上市公司财务异常分析结果的可解释性。分析结果的可解释性。分析结果的可解释性。

【技术实现步骤摘要】
基于机器学习的上市公司财务异常分析方法


[0001]本专利技术涉及金融数据处理
,尤其涉及基于机器学习的上市公司财务异常分析方法。

技术介绍

[0002]传统的上市公司财务异常分析一般从财务会计科目及企业经营着手分析,由专业会计人员,基于业务领域知识,通过对各种会计科目同级比较,发现财务异常风险点。传统的基于财会业务分析方法需要诸多专业人员的深度参与,耗费大量的时间和精力。近年来出现了很多基于机器学习的财务异常分析方法,即借助数据挖掘、机器学习等方法,对大量的样本及特征数据进行大数据分析,发现个体的异常。这种方法分析快速、成本较低,能够预测上市公司的财务异常程度。基于机器学习的财务异常分析方法虽然可以在一定程度上辅助监管人员发现上市公司财务异常程度,但是存在解释性较差的缺陷,即无法较为准确的指出公司具体在什么方面以及在哪些指标存在异常。

技术实现思路

[0003]本专利技术的主要目的在于提供一种基于机器学习的上市公司财务异常分析方法,旨在达成简化提升上市公司财务异常解释的效果。
[0004]为实现上述目的,本专利技术提供一种基于机器学习的上市公司财务异常分析方法,所述基于机器学习的上市公司财务异常分析方法包括以下步骤:
[0005]获取用于训练的财务数据和非财务数据,并对所述财务数据和所述非财务数据进行预处理,得到财务特征数据和非财务特征数据;
[0006]根据所述财务特征数据构建衍生指标,并进行重要特征筛选,获取输入特征;
[0007]基于所述非财务特征数据和所述输入特征训练财务异常分析模型,并基于训练后的所述财务异常分析模型对未知样本进行异常等级预测;
[0008]获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法判断所述未知样本的财务异常类别,并进行指标分析。
[0009]可选地,所述财务数据包括受到证监会行政处罚、自律监管和提醒关注函的高危异常上市公司财务数据、带有退市风险警示和其它风险警示标识的中等异常上市公司财务数据,除所述高危异常上市公司和所述中等异常上市公司之外,信息披露等级为C级或D级的异常上市公司财务数据,以及除所述高危异常上市公司财务数据、所述中等异常上市公司财务数据以及异常上市公司财务数据之外的,无明显异常的上市公司财务数据。
[0010]可选地,所述获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法判断所述未知样本的财务异常类别,并进行指标分析的步骤包括:
[0011]标记历史异常样本对应的异常类别;
[0012]对所述历史异常样本对应的财务异常分析模型分析结果进行向量化处理;
[0013]通过所述财务异常分析模型获取所述未知样本特征数据对应的模型结果向量;
[0014]将所述历史异常样本对应的模型结果向量以及未知样本对应的模型结果向量作为k近邻算法输入,通过k近邻算法判别所述未知样本的异常类别;以及
[0015]基于历史样本,确定不同行业下各项指标的正常区间与异常区间;
[0016]基于指标解释库进行指标分析。
[0017]可选地,所述获取用于训练的财务数据和非财务数据,并对所述财务数据和所述非财务数据进行预处理,得到财务特征数据和非财务特征数据的步骤包括:
[0018]获取用于训练的所述财务数据和所述非财务数据;
[0019]确定财务指标和非财务指标;
[0020]根据所述财务指标和非财务指标,对所述财务数据和所述非财务数据进行清洗和重构,得到所述财务特征数据和所述非财务特征数据。
[0021]可选地,所述根据所述财务特征数据构建衍生指标,并进行重要特征筛选,获取输入特征的步骤包括:
[0022]对所述财务特征数据中待确定是否存在隐含关联关系的财务指标进行分组;
[0023]基于所述财务特征数据以及财务指标分组结果获取回归方程;
[0024]基于所述回归方程构建衍生指标;
[0025]进行重要特征筛选,获取输入特征。
[0026]本专利技术实施例提出一种基于机器学习的上市公司财务异常分析方法,首先获取用于训练的财务数据和重要的非财务数据,构建财务特征和非财务特征。然后通过线性回归方法挖掘财务指标和财务指标之间的隐含关联关系,构建衍生类财务特征。接下来采用LightGBM算法进行特征筛选、模型训练,得到一套财务异常分析模型,通过该模型对未知样本进行异常等级预测,同时可以获取历史异常样本和未知样本的模型输出向量结果。最后采用k近邻算法判断未知样本异常类别,并进行指标分析,从而增强了上市公司财务异常分析结果的可解释性。
附图说明
[0027]图1为本专利技术基于机器学习的上市公司财务异常分析方法一实施例的流程示意图。
[0028]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0029]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0030]传统的上市公司财务异常分析一般从财务会计科目及企业经营着手分析,由专业会计人员,基于业务领域知识,通过对各种会计科目同级比较,发现财务异常风险点。传统的基于财会业务分析方法需要诸多专业人员的深度参与,耗费大量的时间和精力。近年来出现了很多基于机器学习的财务异常分析方法,即借助数据挖掘、机器学习等方法,对大量的样本及特征数据进行大数据分析,发现个体的异常。这种方法分析快速、成本较低,能够预测上市公司的财务异常程度。基于机器学习的财务异常分析方法虽然可以在一定程度上辅助监管人员发现上市公司财务异常程度,但是存在解释性较差的缺陷,即无法较为准确
的指出公司具体在什么方面以及在哪些指标存在异常。
[0031]为解决上述缺陷,本专利技术基于机器学习的上市公司财务异常分析方法的实施例的主要解决方案是:
[0032]获取用于训练的财务数据和非财务数据,并对所述财务数据和所述非财务数据进行预处理,得到财务特征数据和非财务特征数据;
[0033]根据所述财务特征数据构建衍生指标,并进行重要特征筛选,获取输入特征;
[0034]基于所述非财务特征数据和所述输入特征训练财务异常分析模型,并基于训练后的所述财务异常分析模型对未知样本进行异常等级预测;
[0035]获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法判断所述未知样本的财务异常类别,并进行指标分析。
[0036]本方法主要基于财务三大报表数据围绕盈利质量、资产质量、现金流质量等方面构建财务特征,并提取重要的非财务数据如会计事务所异常变更情况等构建非财务特征。然后通过线性回归方法挖掘财务指标和财务指标之间的隐含关联关系,获取回归方程,并基于回归方程构建衍生类财务特征。接下来采用LightGBM算法进行特征筛选、模型训练,得到一套财务异常分析模型,通过该模型对未知样本进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的上市公司财务异常分析方法,其特征在于,所述基于机器学习的上市公司财务异常分析方法包括以下步骤:获取用于训练的财务数据和非财务数据,并对所述财务数据和所述非财务数据进行预处理,得到财务特征数据和非财务特征数据;根据所述财务特征数据构建衍生指标,并进行重要特征筛选,获取输入特征;基于所述非财务特征数据和所述输入特征训练财务异常分析模型,并基于训练后的所述财务异常分析模型对未知样本进行异常等级预测;获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法判断所述未知样本的财务异常类别,并进行指标分析。2.如权利要求1所述的基于机器学习的上市公司财务异常分析方法,其特征在于,所述财务数据包括受到证监会行政处罚、自律监管和提醒关注函的高危异常上市公司财务数据、带有退市风险警示和其它风险警示标识的中等异常上市公司财务数据,除所述高危异常上市公司和所述中等异常上市公司之外,信息披露等级为C级或D级的异常上市公司财务数据,以及除所述高危异常上市公司财务数据、所述中等异常上市公司财务数据以及异常上市公司财务数据之外的,无明显异常的上市公司财务数据。3.如权利要求1所述的基于机器学习的上市公司财务异常分析方法,其特征在于,所述获取历史异常样本和预测为异常的未知样本对应的模型结果向量,并基于所述模型结果向量,通过k近邻算法...

【专利技术属性】
技术研发人员:喻华丽曾海泉王美华周玉臣孙倩南
申请(专利权)人:深圳证券交易所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1