一种基于胶囊网络的企业税收合规风险评估方法技术

技术编号:38223378 阅读:14 留言:0更新日期:2023-07-25 17:55
本发明专利技术属于企业风控技术领域,具体涉及一种基于胶囊网络的企业税收合规风险评估方法,包括:S1:获取企业的税收指标数据,预处理后获取格式化的数据特征;S2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;S3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;S4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;S5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,表示企业在各风险指标上的企业税收合规状况。业税收合规状况。业税收合规状况。

【技术实现步骤摘要】
一种基于胶囊网络的企业税收合规风险评估方法


[0001]本专利技术属于企业风控
,具体涉及一种基于胶囊网络的企业税收合规风险评估方法。

技术介绍

[0002]企业税收合规是指企业按照国家税收法规和政策规定及时、准确地申报和缴纳税款的过程,对企业稳定发展至关重要。企业税收合规风险评估能够有效帮助企业识别和控制风险,提高税收合规水平。
[0003]目前,税收风险主要是靠财务人员对企业的税收关联数据进行分析,以判别企业税收风险的高低。但常与财务人员的主观性相关联,存在主观性和局限性;且由于人工评估效率有限,对参与评估数据的要求较高,需要提前对数据进行清洗和处理,难以处理大量和复杂数据,也导致分析结果准确性难以保证。同时传统风险评估多选择考虑单一风险因素的影响,无法全面、综合地考虑不同风险因素间的关系,易导致分析结果产生较大误差,进而导致税收风险评估的准确率较低。

技术实现思路

[0004]本专利技术在于提供一种基于胶囊网络的企业税收合规风险评估方法,通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的准确性。
[0005]一种基于胶囊网络的企业税收合规风险评估方法,包括如下步骤:S1:获取企业的税收指标数据,并进行预处理,获取格式化的数据特征;S2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;S3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;S4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;S5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,用于表示企业在各风险指标上的企业税收合规状况。
[0006]通过采用残差网络、胶囊网络对企业税收指标类型数据进行学习处理,获取融合
税收特征向量和风险特征向量,同时能够获取企业税收指标风险项;并采用均方差损失函数对残差网络模型和胶囊网络模型进行优化、以及采用余弦相似度计算企业各风险指标存在风险的概率,并输出对应的风险评估结果,以表示企业在对应风险指标上的企业税收合规状况,实现企业税收合规风险的自动、智能评估,帮助企业及时发现潜在风险,提高税收合规水平;能够克服由于财务人员主观性和单一因素考量局限性导致的税收风险评估结果准确性低的技术缺陷,提高税收合规风险评估的准确性。
[0007]进一步的,所述S1中,企业的税收指标数据中数据指标包括:营业收入增长率、毛利率、费用率、有效税率、应纳税额、逾期未缴税款金额、税收违规次数、企业所得税负担率。
[0008]进一步的,所述S1中,对企业的税收指标数据进行预处理,获取格式化的数据特征的过程具体包括如下步骤:S11:基于获取的税收指标数据,对各税收指标数据进行归一化处理;S12:依照时间序列H对W个税收指标类型进行排列,构建时间序列与税收指标类型的二维向量,作为格式化的数据特征。
[0009]进一步的,所述S11中,对各税收指标数据进行归一化处理的计算表达式为:;式中,表示归一化后的税收指标数据值,其取值范围为0至1,表示原始税收指标数据值,表示对应税收指标中的最大值,表示对应税收指标中的最小值。
[0010]进一步的,所述S2中,基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量的过程具体包括:对各税收指标类型数量分别构建残差网络,共个;即设残差网络为函数,其中;残差网络包括卷积层和全连接层;S21:将数据特征的每一列税收指标类型,即,分别作为对应残差网络卷积层的输入;S22:残差网络卷积层对税收指标类型进行卷积处理后,结合跳跃连接,计算各税收指标类型对应的特征向量,并拼接各税收指标类型对应的特征向量,构建新的特征矩阵;各税收指标类型对应的特征向量的计算表达式为:;拼接各税收指标类型对应的特征向量,构建新的特征矩阵,其计算表达式为:;其中,新的特征矩阵的形状为,表示特征向量的长度,表示拼接后特征向量的宽度,即税收指标类型个数;S23:将所构建的特征矩阵作为残差网络全连接层的输入,并采用激活函数进行
激活处理,用于输出融合税收特征向量;融合税收特征向量的计算表达式为:;式中,为激活函数;为残差网络中全连接层的权重矩阵,其形状为;为残差网络中全连接层的偏置向量;为一维的融合税收特征向量,其向量长度为。
[0011]通过残差网络进行特征学习,为企业税收合规风险评估提供关键信息,用于后续的企业税收合规风险评估。
[0012]进一步的,所述S3中,基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量的过程具体包括:S31:将数据特征作为胶囊网络卷积层的输入,获取新的特征图,以提取数据特征的局部特征;新的特征图的计算表达式为:;式中,为激活函数;为胶囊网络中卷积层的权重矩阵;为胶囊网络中卷积层的偏置向量;为卷积操作;S32:基于所得的特征图,利用胶囊网络的胶囊层捕捉表述特征存在和属性的向量;其中,胶囊层为个,每个胶囊层由多个胶囊单元组成;胶囊层的输出向量,用于表示特征的存在和属性,其计算表达式为:;式中,为第个胶囊层的输出向量,其中,;为胶囊层的计算函数;S33:将个胶囊层的输出向量作为动态路由层的输入,通过迭代更新胶囊层和风险特征向量间的连接权重,用于输出风险特征向量;连接权重的计算表达式为:;风险特征向量的计算表达式为:
;式中,表示第个胶囊层和第个风险特征向量间的连接权重;为连接权重的未归一化数据;为归一化函数;为风险特征向量,其向量长度与融合税收特征向量的长度一致,其中,,为风险特征向量个数;为激活函数。
[0013]通过胶囊网络捕捉这些风险特征在数据特征中的存在和属性,为企业税收合规风险评估提供关键信息,用于后续的企业税收合规风险评估。
[0014]进一步的,所述S4中,结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化的过程具体包括:S41:基于真实的税收特征向量和真实的风险特征向量,分别计算残差网络、胶囊网络的损失,并结合权重,计算残差网络和胶囊网络加权损失;残差网络损失函数的计算表达式为:;胶囊网络损失函数的计算表达式为:;残差网络和胶囊网络加权损失的计算表达式为:;式中,、为超参数,用于控制残差网络和胶囊网络损失的权重;S42:采用梯度下降反向传播算法,分别更新残差网络和胶囊网络的权重;残差网络的梯度的计算表达式为:;胶囊网络的梯度的计算表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,包括如下步骤:S1:获取企业的税收指标数据,并进行预处理,获取格式化的数据特征;S2:基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量;S3:基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标间的关系,获取多维度的风险特征向量;S4:结合融合税收特征向量和风险特征向量,采用均方差损失函数进行权重优化;S5:利用余弦相似度计算企业各风险指标存在风险的概率,输出各风险指标对应的风险评估结果,用于表示企业在各风险指标上的企业税收合规状况。2.根据权利要求1所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述S1中,企业的税收指标数据中数据指标包括:营业收入增长率、毛利率、费用率、有效税率、应纳税额、逾期未缴税款金额、税收违规次数、企业所得税负担率。3.根据权利要求1所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述S1中,对企业的税收指标数据进行预处理,获取格式化的数据特征的过程具体包括如下步骤:S11:基于获取的税收指标数据,对各税收指标数据进行归一化处理;S12:依照时间序列H对W个税收指标类型进行排列,构建时间序列与税收指标类型的二维向量,作为格式化的数据特征。4.根据权利要求3所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述S11中,对各税收指标数据进行归一化处理的计算表达式为:;式中,表示归一化后的税收指标数据值,其取值范围为0至1,表示原始税收指标数据值,表示对应税收指标中的最大值,表示对应税收指标中的最小值。5.根据权利要求3所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述S2中,基于格式化的数据特征,采用残差网络进行税收指标的特征学习,获取融合税收特征向量的过程具体包括:对各税收指标类型数量分别构建残差网络,共个;即设残差网络为函数,其中;残差网络包括卷积层和全连接层;S21:将数据特征的每一列税收指标类型,即,分别作为对应残差网络卷积层的输入;S22:残差网络卷积层对税收指标类型进行卷积处理后,结合跳跃连接,计算各税收指标类型对应的特征向量,并拼接各税收指标类型对应的特征向量,构建新的特征矩阵;
各税收指标类型对应的特征向量的计算表达式为:;拼接各税收指标类型对应的特征向量,构建新的特征矩阵,其计算表达式为:;其中,新的特征矩阵的形状为,表示特征向量的长度,表示拼接后特征向量的宽度,即税收指标类型个数;S23:将所构建的特征矩阵作为残差网络全连接层的输入,并采用激活函数进行激活处理,用于输出融合税收特征向量;融合税收特征向量的计算表达式为:;式中,为激活函数;为残差网络中全连接层的权重矩阵,其形状为;为残差网络中全连接层的偏置向量;为一维的融合税收特征向量,其向量长度为。6.根据权利要求5所述的一种基于胶囊网络的企业税收合规风险评估方法,其特征在于,所述S3中,基于格式化的数据特征,采用胶囊网络对税收指标数据进行特征提取,捕捉不同风险指标...

【专利技术属性】
技术研发人员:胡为民黄婵娟何永定张丽
申请(专利权)人:深圳市迪博企业风险管理技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1