模型训练方法、装置及系统制造方法及图纸

技术编号:26971810 阅读:28 留言:0更新日期:2021-01-06 00:03
本公开提供用于训练线性/逻辑回归模型的方法和装置。在该方法中,在训练发起方处,将特征样本集和标记值分别分割为第一数目个特征样本子集和第一数目个部分标记值,并将第二数目个特征样本子集和部分标记值中的每个分别发送给对应的训练协同方。然后,基于各个训练参与方的当前子模型和对应的特征样本子集,使用秘密共享矩阵乘法来获得各个训练参与方的当前预测值。在各个训练参与方处,确定各自的预测差值,并且基于特征样本集和各自的预测差值,确定各自的模型更新量。然后,在各个训练参与方处,基于各自的当前子模型以及对应的模型更新量来更新各自的子模型。循环执行上述过程,直到满足循环结束条件。

【技术实现步骤摘要】
模型训练方法、装置及系统
本公开通常涉及机器学习领域,尤其涉及用于使用水平切分的训练集来经由多个训练参与方协同训练线性/逻辑回归模型的方法、装置及系统。
技术介绍
线性回归模型和逻辑回归模型是机器学习领域广泛使用的回归/分类模型。在很多情况下,多个模型训练参与方(例如,电子商务公司、快递公司和银行)各自拥有训练线性/逻辑回归模型所使用的特征样本的不同部分数据。该多个模型训练参与方通常想共同使用彼此的数据来统一训练线性/逻辑回归模型,但又不想把各自的数据提供给其它各个模型训练参与方以防止自己的数据被泄露。面对这种情况,提出了能够保护数据安全的机器学习方法,其能够在保证多个模型训练参与方的各自数据安全的情况下,协同该多个模型训练参与方来训练线性/逻辑回归模型,以供该多个模型训练参与方使用。然而,现有的能够保护数据安全的机器学习方法的模型训练效率较低。
技术实现思路
鉴于上述问题,本公开提供了一种用于经由多个训练参与方协同训练线性/逻辑回归模型的方法、装置及系统,其能够在保证多个训练参与方的各自数据安全的情况下提高模型训练的效率。本文档来自技高网...

【技术保护点】
1.一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的方法,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述训练发起方的训练样本数据具有特征样本集和标记值,所述训练样本数据是通过水平切分得到的,所述方法由训练发起方执行,所述方法包括:/n执行下述循环过程,直到满足循环结束条件:/n将所述特征样本集分割为所述第一数目个特征样本子集,并将第二数目个特征样本子集中的每个分别发送给对应的训练协同方,所述第二数目等于所述第一数目减一;/n基于各个训练参与方的当前子模型和所述训练发...

【技术特征摘要】
1.一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的方法,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述训练发起方的训练样本数据具有特征样本集和标记值,所述训练样本数据是通过水平切分得到的,所述方法由训练发起方执行,所述方法包括:
执行下述循环过程,直到满足循环结束条件:
将所述特征样本集分割为所述第一数目个特征样本子集,并将第二数目个特征样本子集中的每个分别发送给对应的训练协同方,所述第二数目等于所述第一数目减一;
基于各个训练参与方的当前子模型和所述训练发起方的特征样本子集,使用秘密共享矩阵乘法来获得所述训练发起方的当前预测值;
将所述标记值分割为所述第一数目个部分标记值,并将所述第二数目个部分标记值中的每个分别发送给对应的训练协同方;
确定所述训练发起方的当前预测值与对应的部分标记值之间的预测差值;
基于所述特征样本集和所述训练发起方处的预测差值,确定所述训练发起方处的模型更新量;以及
基于所述训练发起方的当前子模型以及对应的模型更新量来更新所述训练发起方的子模型,其中,在循环过程未结束时,所述更新后的各个训练参与方的子模型被用作下一循环过程的当前子模型。


2.如权利要求1所述的方法,其中,基于各个训练参与方的当前子模型和所述训练发起方的特征样本子集,使用秘密共享矩阵乘法来获得所述训练发起方的当前预测值包括:
基于各个训练参与方的当前子模型和所述训练发起方的特征样本子集,使用有可信初始化方秘密共享矩阵乘法来获得所述训练发起方的当前预测值;或者
基于各个训练参与方的当前子模型和所述训练发起方的特征样本子集,使用无可信初始化方秘密共享矩阵乘法来获得所述训练发起方的当前预测值。


3.如权利要求1所述的方法,其中,基于所述训练发起方的当前子模型以及对应的部分模型更新量来更新所述训练发起方的子模型包括:按照以下等式更新所述训练发起方处的子模型
Wn+1=Wn-α·X·ei,
其中,Wn+1表示所述训练发起方处的更新后的子模型,Wn表示所述训练发起方处的当前子模型,α表示学习率,X表示所述训练发起方处的特征样本集,以及ei表示所述训练发起方处的预测差值。


4.如权利要求1所述的方法,其中,所述训练发起方和所述训练协同方是由所述多个训练参与方协商确定的。


5.如权利要求1到4中任一所述的方法,其中,所述循环结束条件包括:
预定循环次数;或者
所确定出的预测差值位于预定范围内。


6.一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的方法,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述训练发起方的训练样本数据具有特征样本集和标记值,所述训练样本数据是通过水平切分得到的,所述方法由训练协同方执行,所述方法包括:
执行下述循环过程,直到满足循环结束条件:
从所述训练发起方接收对应的特征样本子集,所述特征样本子集是在所述训练发起方处对所述特征样本集进行分割而得到的所述第一数目个特征样本子集中的一个特征样本子集;
基于各个训练参与方的当前子模型和所述训练协同方的特征样本子集,使用秘密共享矩阵乘法来获得所述训练协同方的当前预测值;
从所述训练发起方接收对应的部分标记值,所述部分标记值是在所述训练发起方处对所述标记值进行分割后得到的所述第一数目个部分标记值中的一个部分标记值;
使用所述训练协同方的当前预测值和所接收的部分标记值,确定所述训练协同方处的预测差值;
基于所述特征样本集和所述训练协同方的预测差值,使用秘密共享矩阵乘法来获得所述训练协同方的模型更新量;以及
基于所述训练协同方的当前子模型以及对应的模型更新量来更新所述训练协同方的子模型,其中,在循环过程未结束时,所述更新后的各个训练参与方的子模型被用作下一循环过程的当前子模型。


7.如权利要求6所述的方法,其中,基于各个训练参与方的当前子模型和所述训练协同方的特征样本子集,使用秘密共享矩阵乘法来获得所述训练协同方的当前预测值包括:
基于各个训练参与方的当前子模型和所述训练协同方的特征样本子集,使用有可信初始化方秘密共享矩阵乘法来获得所述训练发起方的当前预测值;或者
基于各个训练参与方的当前子模型和所述训练协同方的特征样本子集,使用无可信初始化方秘密共享矩阵乘法来获得所述训练发起方的当前预测值。


8.如权利要求6所述的方法,其中,基于所述特征样本集和所述训练协同方的预测差值,使用秘密共享矩阵乘法来获得所述训练协同方的模型更新量包括:
基于所述特征样本集和所述训练协同方的预测差值,使用有可信初始化方秘密共享矩阵乘法来获得所述训练协同方的模型更新量;或者
基于所述特征样本集和所述训练协同方的预测差值,使用无可信初始化方秘密共享矩阵乘法来获得所述训练协同方的模型更新量。


9.如权利要求6所述的方法,其中,基于所述训练协同方的当前子模型以及对应的部分模型更新量来更新所述训练协同方的子模型包括:按照以下等式更新所述训练协同方处的子模型
Wn+1=Wn-α·X·ei,
其中,Wn+1表示所述训练协同方处的更新后的当前子模型,Wn表示所述训练协同方处的当前子模型,α表示学习率,X表示所述训练发起方处的特征样本集,以及ei表示所述训练协同方处的预测差值。


10.如权利要求6所述的方法,其中,所述训练发起方和所述训练协同方是由所述多个训练参与方协商确定的。


11.一种用于经由多个训练参与方来协同训练线性/逻辑回归模型的装置,所述线性/逻辑回归模型由第一数目个子模型组成,每个训练参与方具有一个子模型,所述第一数目等于所述训练参与方的数目,所述训练参与方包括训练发起方和至少一个训练协同方,所述训练发起方的训练样本数据具有特征样本集和标记值,所述训练样本数据是通过水平切分得到的,所述装置位于训练发起方侧,所述装置包括:
样本分割单元,被配置为将所述特征样本集分割为所述第一数目个特征样本子集;
样本发送单元,被配置为将第二数目个特征样本子集中的每个分别发送给对应的训练协同方,所述第二数目等于所述第一数目减一;
预测值获取单元,被配置为基于各个训练参与方的当前子模型和所述训练发起方的特征样本子集,使用秘密共享矩阵乘法来获得所述训练发起方的当前预测值;

【专利技术属性】
技术研发人员:陈超超李梁王力周俊
申请(专利权)人:创新先进技术有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1