联邦多目标分类方法及系统技术方案

技术编号:39575611 阅读:7 留言:0更新日期:2023-12-03 19:27
本发明专利技术公开了一种联邦多目标分类方法及系统,该方法包括:发起方生成公私钥,并将公钥发送至参与方;发起方计算两方数据集与初始参数的乘积组成的乘积矩阵,通过乘积矩阵及预测函数得到预测值;发起方通过标签矩阵与预测值计算梯度更新参数,将梯度更新参数采用公钥加密得到密文矩阵,将密文矩阵发送给参与方;参与方将第三乘积密文掩码加密后发送至发起方,发起方将解密结果发送至参与方;发起方根据梯度更新参数更新发起方初始参数,参与方根据解密结果更新参与方初始参数;重复训练至预测函数收敛,采用预测函数对待预测数据的类别进行分类,根据分类结果对用户的信用等级进行评估,提高模型训练的效率及预测准确度

【技术实现步骤摘要】
联邦多目标分类方法及系统


[0001]本专利技术涉及隐私计算领域,尤其涉及一种联邦多目标分类方法及系统


技术介绍

[0002]在联邦用户画像的场景中,会涉及到多标签的场景

例如,银行风控场景中,有“诈骗”、“老赖”和“正常用户”等标签,对于一个用户来说这些标签有且只有一个

[0003]在之前方案中,对模型的训练大部分采用
one vs all
的方案,这样会降低模型训练的效率

另外,在上述的场景中,“诈骗”、“老赖”等用户相对于正常用户,样本量还是比较少的
(
通常的比例低于
1:100)
,模型训练的时候会存在样本不均衡的情况,训练得到的模型预测准确率较低

之前设计方案中,更多的是从采样的角度考虑,如上采样
、SMOTE
采样等,这样做会增加训练的样本量从而降低模型训练效率,且训练过程中存在样本标签泄露的风险

[0004]针对现有技术中无法兼顾模型训练效率及模型预测准确率的问题,目前还没有一个有效的解决方法


技术实现思路

[0005]为解决上述问题,本专利技术提供一种联邦多目标分类方法及系统,在诸如银行风控等涉及多目标分类联邦用户画像场景中,可通过该方案对这些场景中的各个标签进行更为准确的预估分类,通过在模型训练的过程中对预测函数中的参数进行更新,使正负样本不均衡的场景中,当对异常样本预测错误时加大惩罚,以多次迭代得到更加准确的预测函数,在不增加样本量的情况下保证模型预测的准确度,从而解决现有技术中在多目标分类的场景中无法兼顾模型训练效率及模型预测准确率的问题

[0006]为达到上述目的,本专利技术提供一种联邦多目标分类方法,所述方法用于对银行用户的信用等级进行评估,所述方法包括:
S1、
发起方通过同态加密算法生成公钥和私钥,并将公钥发送至参与方;
S2、
发起方计算发起方数据集与发起方初始参数的第一乘积,参与方计算参与方数据集与参与方初始参数的第二乘积,发起方接收所述参与方发送的第二乘积,并计算第一乘积与第二乘积的乘积矩阵,通过所述乘积矩阵及预测函数得到预测值;
S3、
发起方通过标签矩阵与预测值计算梯度更新参数,将所述梯度更新参数采用公钥加密得到密文矩阵,将所述密文矩阵发送给参与方;
S4、
参与方计算密文矩阵与参与方数据集的第三乘积密文,掩码加密所述第三乘积密文得到加密结果,将所述加密结果发送至发起方,发起方通过所述私钥解密所述加密结果后得到解密结果,并将所述解密结果发送至参与方;
S5、
发起方根据所述梯度更新参数更新所述发起方初始参数,参与方根据所述解密结果更新所述参与方初始参数;
S6、
重复步骤
S2

S5
,直至所述预测函数收敛,采用所述预测函数对待预测数据的类别进行分类,根据分类结果对用户的信用等级进行评估

[0007]进一步可选的,所述预测函数为:
[0008][0009]其中,所述
P

为样本的预测值,
P
为数据集和参数的乘积值组成的乘积矩阵,
i
为第
i
个类别,
P
i
为乘积矩阵
P
的第
i
列;
[0010]所述发起方通过标签矩阵与预测值计算梯度更新参数通过下式计算:
[0011]G

α
(P
′‑
Y)(1

P

)
γ
[0012]其中,
G
为梯度更新参数,
α
为控制正负样本正确的权重,
γ
为调节因子,
Y
为标签矩阵

[0013]进一步可选的,所述发起方根据所述梯度更新参数更新所述发起方初始参数,包括:计算所述梯度更新参数与发起方数据集的第四乘积;采用所述第四乘积更新所述发起方初始参数

[0014]进一步可选的,所述参与方根据所述解密结果更新所述参与方初始参数,包括:对所述解密结果采用掩码进行解密,得到第三乘积;采用所述第三乘积更新所述参与方初始参数

[0015]进一步可选的,所述采用所述第四乘积更新所述发起方初始参数,通过下式计算:
[0016]θ

A

θ
A

η
GX
A
[0017]其中,
θ

A
为更新后的发起方参数,
θ
A
为发起方初始参数,
η
为学习率,
X
A
为发起方数据集;
[0018]所述采用所述第三乘积更新所述参与方初始参数,通过下式计算:
[0019]θ

B

θ
B

η
GX
B
[0020]其中,
θ

B
为更新后的参与方参数,
θ
B
为参与方初始参数,
X
B
为参与方数据集

[0021]另一方面,本专利技术还提供一种联邦多目标分类系统,所述系统用于对银行用户的信用等级进行评估,所述系统包括:同态加密模块,用于发起方通过同态加密算法生成公钥和私钥,并将公钥发送至参与方;计算模块,用于发起方计算发起方数据集与发起方初始参数的第一乘积,参与方计算参与方数据集与参与方初始参数的第二乘积,发起方接收所述参与方发送的第二乘积,并计算第一乘积与第二乘积的乘积矩阵,通过所述乘积矩阵及预测函数得到预测值;密文矩阵生成模块,用于发起方通过标签矩阵与预测值计算梯度更新参数,将所述梯度更新参数采用公钥加密得到密文矩阵,将所述密文矩阵发送给参与方;解密模块,用于参与方计算密文矩阵与参与方数据集的第三乘积密文,掩码加密所述第三乘积密文得到加密结果,将所述加密结果发送至发起方,发起方通过所述私钥解密所述加密结果后得到解密结果,并将所述解密结果发送至参与方;参数更新模块,用于发起方根据所述梯度更新参数更新所述发起方初始参数,参与方根据所述解密结果更新所述参与方初始参数;类别预测模块,用于重复计算模块

密文矩阵生成模块

解密模块及参数更新模块的步骤,直至所述预测函数收敛,采用所述预测函数对待预测数据的类别进行分类,根据分类结果对用户的信用等级进行评估

[0022]进一步可选的,所述预测函数为:
[0023][0024]其中,所述
P

为样本的预测值,
P
为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种联邦多目标分类方法,其特征在于,所述方法用于对银行用户的信用等级进行评估,所述方法包括:
S1、
发起方通过同态加密算法生成公钥和私钥,并将公钥发送至参与方;
S2、
发起方计算发起方数据集与发起方初始参数的第一乘积,参与方计算参与方数据集与参与方初始参数的第二乘积,发起方接收所述参与方发送的第二乘积,并计算第一乘积与第二乘积的乘积矩阵,通过所述乘积矩阵及预测函数得到预测值;
S3、
发起方通过标签矩阵与预测值计算梯度更新参数,将所述梯度更新参数采用公钥加密得到密文矩阵,将所述密文矩阵发送给参与方;
S4、
参与方计算密文矩阵与参与方数据集的第三乘积密文,掩码加密所述第三乘积密文得到加密结果,将所述加密结果发送至发起方,发起方通过所述私钥解密所述加密结果后得到解密结果,并将所述解密结果发送至参与方;
S5、
发起方根据所述梯度更新参数更新所述发起方初始参数,参与方根据所述解密结果更新所述参与方初始参数;
S6、
重复步骤
S2

S5
,直至所述预测函数收敛,采用所述预测函数对待预测数据的类别进行分类,根据分类结果对用户的信用等级进行评估
。2.
根据权利要求1所述的联邦多目标分类方法,其特征在于,所述预测函数为:其中,所述
P

为样本的预测值,
P
为数据集和参数的乘积值组成的乘积矩阵,
i
为第
i
个类别,
P
i
为乘积矩阵
P
的第
i
列;所述发起方通过标签矩阵与预测值计算梯度更新参数通过下式计算:
G

α
(P


Y)(1

P

)
γ
其中,
G
为梯度更新参数,
α
为控制正负样本正确的权重,
γ
为调节因子,
Y
为标签矩阵
。3.
根据权利要求1所述的联邦多目标分类方法,其特征在于,所述发起方根据所述梯度更新参数更新所述发起方初始参数,包括:
S501、
计算所述梯度更新参数与发起方数据集的第四乘积;
S502、
采用所述第四乘积更新所述发起方初始参数
。4.
根据权利要求3所述的联邦多目标分类方法,其特征在于,所述参与方根据所述解密结果更新所述参与方初始参数,包括:
S503、
对所述解密结果采用掩码进行解密,得到第三乘积;
S504、
采用所述第三乘积更新所述参与方初始参数
。5.
根据权利要求4所述的联邦多目标分类方法,其特征在于,所述采用所述第四乘积更新所述发起方初始参数,通过下式计算:
θ

A

θ
A

η
GX
A
其中,
θ

A
为更新后的发起方参数,
θ
A
为发起方初始参数,
η
为学习率,
X
A
为发起方数据集;所述采用所述第三乘积更新所述参与方初始参数,通过下式计算:
θ

B

θ
B

η
GX
B
其中,
θ

B
为更新后的参与方参数,
θ
B
...

【专利技术属性】
技术研发人员:张宇兰春嘉
申请(专利权)人:上海零数众合信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1