纵向联邦学习模型的训练方法、装置、电子设备、介质制造方法及图纸

技术编号：39976838 阅读：10 留言：0更新日期：2024-01-09 01:13

本发明专利技术公开了纵向联邦学习模型的训练方法、装置、电子设备、介质。方法应用于多个参与方中的任一参与方，训练方法包括：响应于联邦学习任务，确定联邦学习任务涉及的任务算法，任务算法包括明文算子和联邦算子；从本地获取明文算子包含的变量对应的第一训练数据，并代入明文算子得到第一明文计算结果；将第一明文计算结果与密文计算结果代入联邦算子进行安全计算，以得到用于联邦学习模型的训练的数据对象；其中，密文计算结果为其他参与方提供的第二明文计算结果的密文形态，第二明文计算结果由其他参与方从其本地获取明文算子包含的变量对应的第二训练数据代入明文算子计算得到。本发明专利技术极大减少了通信次数和数量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型训练，尤其涉及一种纵向联邦学习模型的训练方法、装置、电子设备、介质。

技术介绍

1、联邦学习作为一种数据安全计算的技术，其能够实现在原始数据不出门的前提下，让数据价值在各个机构之间进行流动，创造业务价值，比如应用在金融风控、广告推荐等领域。联邦学习是一种分布式计算架构，支持多方安全计算，根据不同的业务使用场景，主要包括纵向联邦学习、横向联邦学习以及联邦迁移算法三种类型。目前联邦学习已经可以支持多种机器学习算法。

2、目前对于纵向联邦学习，实现方式有很多，比如基于半同态加密、差分隐私、安全多方计算(mpc)等隐私保护手段。然而目前实现的各类方式，都伴随很多问题，特别是在高安全性、高精度、大规模计算场景。比如半同态加密算法，由于加密以及加密后的数值计算耗时，在大规模数据场景下，很难高效执行，并且基于半同态加密，模型其实也是暴露了一些信息，比如标签方相对特征方会拥有更多信息。而差分隐私通过牺牲精度的方式来提升计算性能，精度与模型识别准确率相关，如何找到平衡点也是难题。而采用多方安全计算(mpc或smpc)，在安全性上具备较好的优势，且能够保证精度，并且计算效率高，但令人诟病的是多方安全计算的通信开销较大。

技术实现思路

1、本专利技术要解决的技术问题是为了克服现有技术中纵向联邦学习模型的训练过程中通信开销很大的缺陷，提供一种纵向联邦学习模型的训练方法、装置、电子设备、介质。

2、本专利技术是通过下述技术方案来解决上述技术问题：

3、第

4、响应于联邦学习任务，确定所述联邦学习任务涉及的任务算法，所述任务算法包括明文算子和联邦算子；

5、从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到第一明文计算结果；

6、将所述第一明文计算结果与密文计算结果代入所述联邦算子进行安全计算，以得到用于联邦学习模型的训练的数据对象；其中，所述密文计算结果为其他参与方提供的第二明文计算结果的密文形态，所述第二明文计算结果由所述其他参与方从其本地获取明文算子包含的变量对应的第二训练数据代入所述明文算子计算得到。

7、可选地，还包括：

8、响应于数据获取请求，从本地获取所述明文算子包含的变量对应的第三训练数据，并代入所述明文算子得到第三明文计算结果；

9、将所述第三明文计算结果的密文形态发送给所述其他参与方。

10、可选地，

11、所述密文计算结果为标量。

12、可选地，所述第一训练数据包括训练样本特征数据；

13、从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到明文计算结果，包括：

14、将所述训练样本特征数据代入所述明文算子得到明文计算结果；

15、将所述明文计算结果与密文计算结果代入所述任务算法得到数据对象，包括：

16、将所述明文计算结果与密文计算结果代入所述任务算法得到对应于所述训练样本特征数据的多个特征数据碎片；

17、将所述多个特征数据碎片中的全部或者部分发送至所述其他参与方，以由所述其他参与方根据其所拥有的特征数据碎片进行联邦学习模型的训练。

18、可选地，所述第一训练数据包括训练样本特征数据的标签；

19、从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到明文计算结果，包括：

20、将所述标签代入所述明文算子得到明文计算结果；

21、将所述明文计算结果与密文计算结果代入所述任务算法得到数据对象，包括：

22、将所述明文计算结果与密文计算结果代入所述任务算法得到对应于所述训练样本特征数据的多个标签碎片；

23、将所述多个标签碎片中的全部或者部分发送至所述其他参与方，以由所述其他参与方根据其所拥有的标签碎片进行联邦学习模型的训练。

24、可选地，所述第一训练数据包括本轮迭代所述联邦学习模型的输出结果；

25、从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到明文计算结果，包括：

26、将所述输出结果代入所述明文算子得到明文计算结果；

27、将所述明文计算结果与密文计算结果代入所述任务算法得到数据对象，包括：

28、将所述明文计算结果与密文计算结果代入所述任务算法得到本轮迭代的多个梯度值碎片；

29、将所述多个梯度值碎片中的全部或者部分发送至所述其他参与方，以由所述其他参与方根据其所拥有的梯度值碎片进行联邦学习模型的训练。

30、可选地，所述训练方法用于训练逻辑回归模型；

31、训练所述逻辑回归模型中使用到的非线性变换函数如下：

32、

33、可选地，从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到第一明文计算结果，包括：

34、对所述第一训练数据进行分组，将每组第一训练数据的均值代入所述明文算子得到第一明文计算结果；

35、所述训练方法还包括：第一训练数据的分组结果与所述第一训练数据的第一对应关系发送给其他参与方，以由其他参与方根据所述对应关系训练联邦学习模型。

36、可选地，所述第二明文计算结果由所述其他参与方对从其本地获取明文算子包含的变量对应的第二训练数据进行分组，并将每组第二训练数据的均值代入所述明文算子计算得到；

37、将所述第一明文计算结果与密文计算结果代入所述联邦算子进行安全计算，以得到用于联邦学习模型的训练的数据对象，包括：

38、根据第二对应关系，确定与各密文计算结果对应的第一明文计算结果，并代入所述联邦算子进行安全计算，以得到用于联邦学习模型的训练的数据对象；其中，所述第二对应关系由其他参与方提供，且所述第二对应关系表征所述第二训练数据的分组结果与所述第一训练数据的对应关系。

39、第二方面，提供一种纵向联邦学习模型的训练装置，应用于多个参与方中的任一参与方，所述训练装置包括：

40、确定模块，用于响应于联邦学习任务，确定所述联邦学习任务涉及的任务算法，所述任务算法包括明文算子和联邦算子；

41、第一计算模块，用于从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到第一明文计算结果；

42、第二计算模块，用于将所述第一明文计算结果与密文计算结果代入所述联邦算子进行安全计算，以得到用于联邦学习模型的训练的数据对象；其中，所述密文计算结果为其他参与方提供的第二明文计算结果的密文形态，所述第二明文计算结果由所述其他参与方从其本地获取明文算子包含的变量对应的第二训练数据代入所述明文算子计算得到。

43、第三方面，提供一种电子设备，包括存储器、处理器及存储在存储器上并可本文档来自技高网...

【技术保护点】

1.一种纵向联邦学习模型的训练方法，其特征在于，应用于多个参与方中的任一参与方，所述训练方法包括：

2.根据权利要求1所述的纵向联邦学习模型的训练方法，其特征在于，还包括：

3.根据权利要求1所述的纵向联邦学习模型的训练方法，其特征在于，

4.根据权利要求1～3中任一项所述的纵向联邦学习模型的训练方法，其特征在于，所述第一训练数据包括训练样本特征数据；

5.根据权利要求1～3中所述的纵向联邦学习模型的训练方法，其特征在于，所述第一训练数据包括训练样本特征数据的标签；

6.根据权利要求1～3中所述的纵向联邦学习模型的训练方法，其特征在于，所述第一训练数据包括本轮迭代所述联邦学习模型的输出结果；

7.根据权利要求1所述的纵向联邦学习模型的训练方法，其特征在于，所述训练方法用于训练逻辑回归模型；

8.根据权利要求1所述的纵向联邦学习模型的训练方法，其特征在于，从本地获取所述明文算子包含的变量对应的第一训练数据，并代入所述明文算子得到第一明文计算结果，包括：

9.根据权利要求1所述的纵向联邦学

10.一种纵向联邦学习模型的训练装置，其特征在于，应用于多个参与方中的任一参与方，所述训练装置包括：

11.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至9任一项所述的纵向联邦学习模型的训练方法。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9任一项所述的纵向联邦学习模型的训练方法。

...

【技术特征摘要】