【技术实现步骤摘要】
基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法
[0001]本专利技术涉及电力和税务联合的
,更具体的说,是基于纵向联邦逻辑回归算法的企业偷税漏税行为智能检测方法。
技术介绍
[0002]为落实国家大数据战略,发挥税务、电力大数据在服务国家治理能力现代化方面的价值。越来越多省份的电力公司与税务局联合开展数据共享业务,深入挖掘电力数据价值,推进税务与电力数据融合,以实现“高能耗、高污染”企业切入点,构建“双高”企业税收贡献指数、业电费及税收风险分析模型。但在数据共享时,往往会涉及到大量的隐私数据,先不说这些隐私数据是否会伤害到用户的权益,仅仅是对于数据拥有方来说,其拥有的隐私数据往往是其竞争力所在,一旦泄露,其本身的竞争力也会下降,因此,数据共享需求与数据隐私之间的矛盾。为保证数据共享过程不会泄露各数据方的数据隐私,各数据方通过纵向联邦学习下的逻辑回归算法进行联合建模,并通过模型评估得到待测企业是否存在偷税漏税行为,提前做出决策。
技术实现思路
[0003]本专利技术的目的是提供基于纵向联邦逻辑回归算法的企业偷税漏税行为智能检测方法,以解决企业偷税漏税行为带来的经济损失等问题。
[0004]为了实现上述目的,本专利技术提供如下技术方案:
[0005]基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,包括:
[0006]通过协调方、电力公司和税务局共同构建并训练逻辑回归模型;
[0007]由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内 ...
【技术保护点】
【技术特征摘要】
1.基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,包括:通过协调方、电力公司和税务局共同构建并训练逻辑回归模型;由协调方将企业id发送给电力公司和税务局,电力公司和税务局计算各自的模型内积发送给协调方,协调方计算评估结果,根据评估结果确定待评企业是否存在偷税漏税行为,评审结果与企业偷税漏税关系表如下:企业id企业不存在偷税漏税行为概率(0)企业存在偷税漏税行为的概率(1)1P
10
P
11
2P
20
P
21
.........nP
n0
P
n1
当P
n0
<P
n1
时,企业存在偷税漏税行为,否则不存在。2.根据权利要求1所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,协调方创建加密密钥对、初始化电力公司和税务局的模型参数,并将公共钥匙和模型参数分别发给电力公司和税务局;电力公司作为数据提供方计算模型参数与自身特征值的内积以及损失函数,加密后发送给税务局;税务局作为模型的发起者计算模型参数与自身特征值的内积,并计算出根据电力公司模型内积、税务局模型内积以及标签计算出预测值与真实值之间残差和总的损失函数,并将残差加密后发送给电力公司,总的损失函数加密后发送给协调方,其中损失函数采用纵向联邦学习下逻辑回归算法的损失函数;电力公司收到加密的残差计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;税务局计算自身模型梯度添加加密状态下的随机掩码并发送给协调方;协调方解密损失函数、电力公司模型梯度、税务局模型梯度,并将解密后的梯度分别发送给电力公司和税务局;电力公司和税务局根据梯度更新模型参数,模型参数由梯度和特征值的内积来进行更新的;迭代训练直至满足预设停止条件,完成逻辑回归模型训练。3.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,所述预设停止条件为损失函数收敛或者迭代次数达到200次。4.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,创建加密密钥对采用的方法是半同态加密,初始化模型参数的方法是随机初始化。5.根据权利要求2所述的基于纵向联邦逻辑回归算法的企业偷税漏税行为检测方法,其特征在于,所述税务局计算预测值与真实值之间残差的步骤,包括:残差的计算首先要得到电力公司和税务局的模型内积和,设电力公司的模型参数为θ
A
,特征为税务局的...
【专利技术属性】
技术研发人员:程宏亮,张鹏飞,刘宏,苟蛟龙,马草,胡辉,高荣,王栋平,
申请(专利权)人:美林数据技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。