【技术实现步骤摘要】
联邦多目标分类方法及系统
[0001]本专利技术涉及隐私计算领域,尤其涉及一种联邦多目标分类方法及系统
。
技术介绍
[0002]在联邦用户画像的场景中,会涉及到多标签的场景
。
例如,银行风控场景中,有“诈骗”、“老赖”和“正常用户”等标签,对于一个用户来说这些标签有且只有一个
。
[0003]在之前方案中,对模型的训练大部分采用
one vs all
的方案,这样会降低模型训练的效率
。
另外,在上述的场景中,“诈骗”、“老赖”等用户相对于正常用户,样本量还是比较少的
(
通常的比例低于
1:100)
,模型训练的时候会存在样本不均衡的情况,训练得到的模型预测准确率较低
。
之前设计方案中,更多的是从采样的角度考虑,如上采样
、SMOTE
采样等,这样做会增加训练的样本量从而降低模型训练效率,且训练过程中存在样本标签泄露的风险
。
[0004]针对现有技术中无法兼顾模型训练效率及模型预测准确率的问题,目前还没有一个有效的解决方法
。
技术实现思路
[0005]为解决上述问题,本专利技术提供一种联邦多目标分类方法及系统,在诸如银行风控等涉及多目标分类联邦用户画像场景中,可通过该方案对这些场景中的各个标签进行更为准确的预估分类,通过在模型训练的过程中对预测函数中的参数进行更新,使正负样本不均衡的场景中,当对异常样本预测错误时加大惩罚,以多次迭代 ...
【技术保护点】
【技术特征摘要】
1.
一种联邦多目标分类方法,其特征在于,所述方法用于对银行用户的信用等级进行评估,所述方法包括:
S1、
发起方通过同态加密算法生成公钥和私钥,并将公钥发送至参与方;
S2、
发起方计算发起方数据集与发起方初始参数的第一乘积,参与方计算参与方数据集与参与方初始参数的第二乘积,发起方接收所述参与方发送的第二乘积,并计算第一乘积与第二乘积的乘积矩阵,通过所述乘积矩阵及预测函数得到预测值;
S3、
发起方通过标签矩阵与预测值计算梯度更新参数,将所述梯度更新参数采用公钥加密得到密文矩阵,将所述密文矩阵发送给参与方;
S4、
参与方计算密文矩阵与参与方数据集的第三乘积密文,掩码加密所述第三乘积密文得到加密结果,将所述加密结果发送至发起方,发起方通过所述私钥解密所述加密结果后得到解密结果,并将所述解密结果发送至参与方;
S5、
发起方根据所述梯度更新参数更新所述发起方初始参数,参与方根据所述解密结果更新所述参与方初始参数;
S6、
重复步骤
S2
‑
S5
,直至所述预测函数收敛,采用所述预测函数对待预测数据的类别进行分类,根据分类结果对用户的信用等级进行评估
。2.
根据权利要求1所述的联邦多目标分类方法,其特征在于,所述预测函数为:其中,所述
P
′
为样本的预测值,
P
为数据集和参数的乘积值组成的乘积矩阵,
i
为第
i
个类别,
P
i
为乘积矩阵
P
的第
i
列;所述发起方通过标签矩阵与预测值计算梯度更新参数通过下式计算:
G
=
α
(P
′
‑
Y)(1
‑
P
′
)
γ
其中,
G
为梯度更新参数,
α
为控制正负样本正确的权重,
γ
为调节因子,
Y
为标签矩阵
。3.
根据权利要求1所述的联邦多目标分类方法,其特征在于,所述发起方根据所述梯度更新参数更新所述发起方初始参数,包括:
S501、
计算所述梯度更新参数与发起方数据集的第四乘积;
S502、
采用所述第四乘积更新所述发起方初始参数
。4.
根据权利要求3所述的联邦多目标分类方法,其特征在于,所述参与方根据所述解密结果更新所述参与方初始参数,包括:
S503、
对所述解密结果采用掩码进行解密,得到第三乘积;
S504、
采用所述第三乘积更新所述参与方初始参数
。5.
根据权利要求4所述的联邦多目标分类方法,其特征在于,所述采用所述第四乘积更新所述发起方初始参数,通过下式计算:
θ
′
A
=
θ
A
‑
η
GX
A
其中,
θ
′
A
为更新后的发起方参数,
θ
A
为发起方初始参数,
η
为学习率,
X
A
为发起方数据集;所述采用所述第三乘积更新所述参与方初始参数,通过下式计算:
θ
′
B
=
θ
B
‑
η
GX
B
其中,
θ
′
B
为更新后的参与方参数,
θ
B
...
【专利技术属性】
技术研发人员:张宇,兰春嘉,
申请(专利权)人:上海零数众合信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。