【技术实现步骤摘要】
基于纵向联邦逻辑回归的企业电费缴纳风险预测方法及系统
[0001]本专利技术属于数据安全领域,涉及一种基于纵向联邦逻辑回归的企业电费缴纳风险预测方法及系统。
技术介绍
[0002]用电企业欠费风险是指因用电企业关停、破产、重组、转制,用户经营不良,用户流动资金紧缺,用户转租,社会稳定等原因,引起电费不能及时缴纳等风险。用电企业电费缴纳风险预测方法是通过建立风险评价指标体系、利用机器学习技术建立风险评估模型来定量、有效地进行风险界定的智能化预测方法。联邦学习是一种新兴的隐私保护机器学习范式,其可以基于各方拥有的分散的数据训练模型,同时保证数据隐私。基于纵向联邦逻辑回归的用电企业电费缴纳风险预测能够有效结合电网的企业用电数据以及工信局的企业运营相关数据进行联合预测,提高电费回收风险评估精度,同时保证电网和工信局数据不被泄露。隐私计算技术是实现联邦过程数据隐私保护的关键技术,但目前纵向逻辑回归方案主要通过使用同态加密或差分隐私技术实现隐私保护,因此以往的方案常常表现为计算复杂度高或模型精度受损,从而难以支撑大规模电网数据集上精准的 ...
【技术保护点】
【技术特征摘要】
1.基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,包括:步骤1、样本对齐;输入预测模型训练所需的数据集,并调用加密隐私求交协议进行数据的ID求交和对齐;步骤2、参数初始化;初始化预测模型,最大迭代次数T,学习率α,学习终止条件和纵向逻辑回归模型的模型参数θ
A
和θ
B
;步骤3、秘密份额安全交互;基于纵向逻辑回归模型的模型参数、样本对齐后的数据,获取逻辑回归模型的中间参数;基于逻辑回归模型的中间参数和生成随机秘密份额,获取中间参数秘密份额和数据标签秘密份额;步骤4、计算模型损失;基于中间数据秘密份额和数据标签秘密份额计算共享误差的秘密份额;步骤5、计算梯度信息;基于共享误差的秘密份计算模型误差,并计算模型梯度信息;步骤6、更新模型参数;利用模型梯度信息及初始化设置的学习率更新模型参数;步骤7、完成模型训练;迭代步骤3至步骤7,直至达到学习中止条件或给定的最大迭代次数T,完成训练。2.根据权利要求1所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,所述步骤1、步骤3、步骤4、步骤5和到步骤6为发起方和参与方共同参与的工作;所述步骤2为发起方单独参与的工作。3.根据权利要求2所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,所述采集输入预测模型训练所需的数据集,并调用加密隐私求交协议进行数据的ID求交和对齐;具体为:发起方与参与方输入预测模型训练所需的数据集(X
A
,Y)、X
B
,并调用加密隐私求交协议进行数据ID的求交和对齐,确定双方数据中可以用来进行模型训练的交集部分并形成ID一一对齐的联合数据表,此时双方的交集数据仍然分别存储在各自的本地空间,分别表示为(X
′
A
,Y
′
)、X
′
B
。4.根据权利要求3所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,所述随机秘密份额为参与方和发起方随机生成;发起方生成随机秘密份额参与方生成随机秘密份额5.根据权利要求4所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,所述基于纵向逻辑回归模型的模型参数、样本对齐后的数据,获取逻辑回归模型的中间参数;基于逻辑回归模型的中间参数和生成随机秘密份额,获取中间参数秘密份额和数据标签秘密份额;具体为:发起方基于样本对齐后的己方数据(X
′
A
,Y
′
)中的数据X
′
A
计算逻辑回归模型的中间参数u
A
,并计算应属于参与方的中间参数秘密份额<u
A
>
B
、应属于发起方的中间参数秘密份额<u
A
>
A
,基于样本对齐后的己方数据(X
′
A
,Y
′
)中的标签数据y
′
计算应属于参与方的数据标签秘密份额<Y
′
>
B
,以及应属于发起方的数据标签秘密份额<Y
′
>
A
,并将秘密份额<u
A
>
B
、<Y
′
>
B
发送给参与方;参与方基于样本对齐后的己方数据X
′
B
计算逻辑回归模型的中间参数u
B
,计算发起方的中间参数秘密份额为<u
B
>
A
,参与方的秘密份额<u
B
>
B
,并将秘密份额<u
B
>
A
发送发起方。
6.根据权利要求5所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法,其特征在于,所述步骤3的具体为推到过程为:步骤3.1、建立纵向逻辑回归损失函数的优化问题其中,θ∈R
n
为模型参数,n为模型参数的维度,同时为数据的特征维度,x
i
表示数据集X
′
∈R
m
×
n
中第i个数据样本,X
′
表示联合数据表X
A
′
||X
′
B
,m为交集数据的样本数目,y
i
为x
i
对应的标签;对数似然函数为l(θ;x
i
;y
i
)=log(1+exp(y
i
θ
T
x
i
))假设发起方和参与方分别持有各自特征对应的模型参数和其中n
A
为发起方模型参数θ
A
的维度,n
B
为参与方模型参数...
【专利技术属性】
技术研发人员:毛正雄,李辉,黄祖源,田园,陆光前,耿贞伟,张航,保富,原野,
申请(专利权)人:云南电网有限责任公司信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。