基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法技术

技术编号:32274993 阅读:12 留言:0更新日期:2022-02-12 19:40
本发明专利技术公开了基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,包括:通过协调方、电力公司和税务局共同构建并训练逻辑回归模型;由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方,协调方计算评估结果,根据评估结果确定待评企业是否存在偷税漏税行为“电力数据+税收”的综合运用不仅可用于宏观经济研究,还可用于微观经济运行分析。本发明专利技术实用性强,实现对企业偷税漏税行为的监控和管理,意义重大。大。大。

【技术实现步骤摘要】
基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法


[0001]本专利技术涉及电力和税务联合的
,更具体的说,是基于纵向联邦逻辑回归算法的企业偷税漏税行为智能检测方法。

技术介绍

[0002]为落实国家大数据战略,发挥税务、电力大数据在服务国家治理能力现代化方面的价值。越来越多省份的电力公司与税务局联合开展数据共享业务,深入挖掘电力数据价值,推进税务与电力数据融合,以实现“高能耗、高污染”企业切入点,构建“双高”企业税收贡献指数、业电费及税收风险分析模型。但在数据共享时,往往会涉及到大量的隐私数据,先不说这些隐私数据是否会伤害到用户的权益,仅仅是对于数据拥有方来说,其拥有的隐私数据往往是其竞争力所在,一旦泄露,其本身的竞争力也会下降,因此,数据共享需求与数据隐私之间的矛盾。为保证数据共享过程不会泄露各数据方的数据隐私,各数据方通过纵向联邦学习下的逻辑回归算法进行联合建模,并通过模型评估得到待测企业是否存在偷税漏税行为,提前做出决策。

技术实现思路

[0003]本专利技术的目的是提供基于纵向联邦逻辑回归算法的企业偷税漏税行为智能检测方法,以解决企业偷税漏税行为带来的经济损失等问题。
[0004]为了实现上述目的,本专利技术提供如下技术方案:
[0005]基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,包括:
[0006]通过协调方、电力公司和税务局共同构建并训练逻辑回归模型;
[0007]由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方,协调方计算评估结果,根据评估结果确定待评企业是否存在偷税漏税行为,评审结果与企业偷税漏税关系表如下:
[0008][0009][0010]当P
n0
<P
n1
时,企业存在偷税漏税行为,否则不存在。
[0011]在本专利技术一个优选实施例中,协调方创建加密密钥对、初始化模型参数,并将公共钥匙和模型参数分别发给电力公司和税务局。
[0012]电力公司作为数据提供方计算模型参数与自身特征值的内积以及损失函数,加密后发送给税务局;
[0013]税务局作为模型的发起者计算模型参数与自身特征值的内积,并计算出根据电力
公司模型内积、税务局模型内积以及标签计算出预测值与真实值之间残差和总的损失函数,并将残差加密后发送给电力公司,总的损失函数加密后发送给协调方。
[0014]电力公司收到加密后的残差计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;
[0015]税务局计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;协调方解密损失函数、电力公司模型梯度、税务局模型梯度,并将解密后的梯度分别发送给电力公司和税务局。
[0016]电力公司和税务局根据梯度更新模型参数,迭代训练直至满足预设停止条件(损失函数收敛或者迭代次数达到200次),完成逻辑回归模型训练。
[0017]由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方,协调方计算评估结果,根据评估结果确定待评企业是否存在偷税漏税行为。
[0018]优选的,协调方创建加密密钥对、初始化两公司的模型参数,并将公共钥匙和模型参数分别发给电力公司和税务局。其中创建加密密钥对采用的方法是半同态加密,初始化模型参数的方法是随机初始化。
[0019]优选的,所述税务局计算预测值与真实值之间残差,包括:
[0020]电力公司所接受到的加密后的残差是税务局根据逻辑回归算法中残差计算得到,具体公式如下:
[0021][0022]残差的计算首先要得到电力公司和税务局的模型内积和,设电力公司的模型参数为θ
A
,特征为税务局的模型参数为θ
B
,特征为则两公司模型的内积和为:
[0023][0024]把计算得到的内积和带入上述残差d
i
的计算公式,即可得到残差d
i

[0025][0026]优选的,电力公司和税务局计算自身模型梯度添加加密状态下的随机掩码并发送给协调方,包括:
[0027]根据梯度等于残差与特征的乘积,计算梯度并添加随机掩码掩码加密后发送给协调方。
[0028]税务局:
[0029](1)计算梯度
[0030][0031]其中d
i
为预测值和真实值之间的残差。
[0032](2)随机初始化掩码R
B
,并计算下式将结果发送给协调方。
[0033][0034]其中[[.]]为半同态加密。
[0035]电力公司:
[0036](1)计算梯度
[0037][0038]其中[[.]]为半同态加密。
[0039](2)随机初始化掩码R
A
,并计算下式将结果发送给协调方。
[0040]优选的,协调方解密损失函数的步骤,包括:
[0041]协调方解密损失函数,该损失函数式电力公司和税务局总的损失函数,由税务局根据逻辑回归算法计算得到,具体计算公式如下:
[0042][0043]协调方根据模型的损失函数是否收敛或者达到迭代上限判断模型训练是否结束。
[0044]优选的,电力公司和税务局根据梯度更新模型参数的步骤,包括:
[0045]电力公司、税务局收到解密后的梯度加随机掩码,首先减去随机掩码,然后根据梯度来更新模型参数,具体更新公式如下:
[0046][0047][0048]其中分别表示电力公司和税务局第i次迭代的模型参数。
[0049]优选的,协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方的步骤,包括:
[0050]电力公司和税务局根据企业id,找到对应的企业模型参数和特征,计算模型内积并发送给协调方。设企业id为i,具体计算公式如下:
[0051][0052][0053]其中分别代表企业id为i的企业在电力公司和税务局的模型内积,别代表企业id为i的企业在电力公司和税务局的特征。
[0054]优选的,协调方计算评估结果的步骤,包括:
[0055]协调方根据电力公司和税务局的模型内积,计算预测值,并根据评估指标对模型的性能做出评估,判断企业是否存在偷税漏税行为。预测值的计算具体如下:
[0056][0057]本专利技术提出的基于纵向联邦逻辑回归算法的企业偷税漏税行为智能检测方法,电力公司和税务局根据对方以及协调方在第i次训练发送的模型中间参数,进行多次本地模型训练和更新,并接受下一次训练所传递的中间参数,进行第i+1次训练的模型更新。这样循环更新,直到总的损失函数收敛或者达到预设的迭代次数位置。模型训练结束进入模型评估环节,协调方把待测企业的id发送给电力公司和税务局,两公司计算各自的模型内积,传回给协调方,由协调方得出该企业是否存在偷税漏税行为,可以提前做出决策。实现对企
业偷税漏税行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,包括:通过协调方、电力公司和税务局共同构建并训练逻辑回归模型;由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方,协调方计算评估结果,根据评估结果确定待评企业是否存在偷税漏税行为,评审结果与企业偷税漏税关系表如下:企业id企业不存在偷税漏税行为概率(0)企业存在偷税漏税行为的概率(1)1P
10
P
11
2P
20
P
21
.........nP
n0
P
n1
当P
n0
<P
n1
时,企业存在偷税漏税行为,否则不存在。2.根据权利要求1所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,协调方创建加密密钥对、初始化电力公司和税务局的模型参数,并将公共钥匙和模型参数分别发给电力公司和税务局;电力公司作为数据提供方计算模型参数与自身特征值的内积以及损失函数,加密后发送给税务局;税务局作为模型的发起者计算模型参数与自身特征值的内积,并计算出根据电力公司模型内积、税务局模型内积以及标签计算出预测值与真实值之间残差和总的损失函数,并将残差加密后发送给电力公司,总的损失函数加密后发送给协调方,其中损失函数采用纵向联邦学习下逻辑回归算法的损失函数;电力公司收到加密的残差计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;税务局计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;协调方解密损失函数、电力公司模型梯度、税务局模型梯度,并将解密后的梯度分别发送给电力公司和税务局;电力公司和税务局根据梯度更新模型参数,模型参数由梯度和特征值的内积来进行更新的;迭代训练直至满足预设停止条件,完成逻辑回归模型训练。3.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,所述预设停止条件为损失函数收敛或者迭代次数达到200次。4.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,创建加密密钥对采用的方法是半同态加密,初始化模型参数的方法是随机初始化。5.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,所述税务局计算预测值与真实值之间残差的步骤,包括:残差的计算首先要得到电力公司和税务局的模型内积和,设电力公司的模型参数为θ
A
,特征为税务局的...

【专利技术属性】
技术研发人员:程宏亮张鹏飞刘宏苟蛟龙马草胡辉高荣王栋平
申请(专利权)人:美林数据技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1