当前位置: 首页 > 专利查询>北京大学专利>正文

基于联邦学习的数据传输方法、装置以及可读存储介质制造方法及图纸

技术编号:30429685 阅读:14 留言:0更新日期:2021-10-24 17:20
本申请公开了一种基于联邦学习的数据传输方法、装置以及可读存储介质,该方法包括:第一参与节点获取第一密文,根据属于第一参与节点的业务数据对第一密文进行隐私运算,生成第二密文;第一密文是指第二参与节点对初始明文进行加密处理所得的数据;对第二密文进行数值界限预估,得到第二密文对应的明文预估界限值;明文预估界限值用于表征第二密文对应的明文的数值范围;基于明文预估界限值,对第二密文进行加法偏移处理,得到第三密文;根据明文预估界限值和第三密文,生成具有多项式格式的目标压缩密文,发送目标压缩密文至第二参与节点。采用本申请,可以有效降低联邦学习任务中的通信开销,提高联邦学习任务运行的效率。提高联邦学习任务运行的效率。提高联邦学习任务运行的效率。

【技术实现步骤摘要】
基于联邦学习的数据传输方法、装置以及可读存储介质


[0001]本申请涉及互联网
,尤其涉及一种基于联邦学习的数据传输方法、装置以及可读存储介质。

技术介绍

[0002]在人工智能时代,机器学习尤其是深度学习模型的获得需要大量的训练数据作为前提,但在很多业务场景中,模型的训练数据往往分散在各个不同的业务团队、部门、甚至是不同的公司内,由于涉及到用户隐私,这些数据无法直接使用,因此形成了所谓的“数据孤岛”。近年来,联邦学习技术(Federated Learning)迅速发展,为跨团队数据合作、打破“数据孤岛”提供了新的解决思路,并开始从理论研究迈向批量应用的落地阶段。
[0003]联邦学习与普通机器学习任务的核心区别之一在于训练参与方从一方变为了两方甚至多方,因此一个核心问题就在于如何在协调两方或者多方共同完成一个模型训练任务的同时,保护所有参与方的数据安全,不让任何一方得知另一方的数据。现有技术中,同态加密是最常用的安全技术手段之一,该技术可以让参与方在不得知另一方数据的前提下,完成特定的数值运算。然而,同态加密具有一个显著的缺点,即同态加密会导致数据严重膨胀,例如,当密钥为3072比特时,一个32比特的浮点数在同态加密后转为一个6144比特的大整数,膨胀了192倍,这种数据膨胀会造成参与方之间存在巨大的通信开销。

技术实现思路

[0004]本申请实施例提供了一种基于联邦学习的数据传输方法、装置以及可读存储介质,可以有效降低联邦学习任务中的通信开销,提高联邦学习任务运行的效率。
[0005]本申请实施例一方面提供了一种基于联邦学习的数据传输方法,包括:
[0006]第一参与节点获取第一密文,根据属于第一参与节点的业务数据对第一密文进行隐私运算,生成第二密文;第一密文是指第二参与节点对初始明文进行加密处理所得的数据;第二参与节点是指与第一参与节点进行联邦学习的节点;
[0007]对第二密文进行数值界限预估,得到第二密文对应的明文预估界限值;明文预估界限值用于表征第二密文对应的明文的数值范围;
[0008]基于明文预估界限值,对第二密文进行加法偏移处理,得到第三密文;
[0009]根据明文预估界限值和第三密文,生成具有多项式格式的目标压缩密文,发送目标压缩密文至第二参与节点。
[0010]本申请实施例一方面提供了一种基于联邦学习的数据传输方法,包括:
[0011]第二参与节点接收第一参与节点发送的目标压缩密文,采用私钥对目标压缩密文进行解密处理,得到第一压缩明文;第一参与节点是指与第二参与节点进行联邦学习的节点;目标压缩密文是由第一参与节点根据明文预估界限值和第三密文生成的具有多项式格式的密文;第三密文是指第一参与节点基于明文预估界限值对第二密文进行加法偏移处理所得的密文;明文预估界限值是由第一参与节点对第二密文进行数值界限预估得到的,明
文预估界限值用于表征第二密文对应的明文的数值范围;第二密文是指第一参与节点根据属于第一参与节点的业务数据对第一密文进行隐私运算生成的密文,第一密文是指第二参与节点对初始明文进行加密处理所得的数据;
[0012]对具有多项式格式的第一压缩明文进行位运算操作,得到第二明文;
[0013]获取明文预估界限值,基于明文预估界限值对第二明文进行减法复原处理,得到目标明文。
[0014]本申请实施例一方面提供了一种基于联邦学习的数据传输装置,包括:
[0015]运算模块,用于第一参与节点获取第一密文,根据属于第一参与节点的业务数据对第一密文进行隐私运算,生成第二密文;第一密文是指第二参与节点对初始明文进行加密处理所得的数据;第二参与节点是指与第一参与节点进行联邦学习的节点;
[0016]预估模块,用于对第二密文进行数值界限预估,得到第二密文对应的明文预估界限值;明文预估界限值用于表征第二密文对应的明文的数值范围;
[0017]偏移模块,用于基于明文预估界限值,对第二密文进行加法偏移处理,得到第三密文;
[0018]压缩模块,用于根据明文预估界限值和第三密文,生成具有多项式格式的目标压缩密文,发送目标压缩密文至第二参与节点。
[0019]其中,上述运算模块,包括:
[0020]第一运算单元,用于获取属于第一参与节点的业务数据,对业务数据和第一密文进行线性代数运算,得到第二密文;线性代数运算包括标量乘法操作、同态加法操作、标量加法操作中的一种或多种。
[0021]其中,上述预估模块,包括:
[0022]第一获取单元,用于获取初始明文对应的第一数值范围以及业务数据对应的第二数值范围;获取初始明文的第一数据维度以及业务数据的第二数据维度,根据线性代数运算的运算类型,在第一数据维度和第二数据维度中确定目标数据维度;
[0023]第一预估单元,用于基于线性代数运算的运算类型、第一数值范围、第二数值范围以及目标数据维度,生成第二密文对应的明文预估界限值。
[0024]其中,上述初始明文和业务数据均为矩阵;
[0025]上述第一获取单元,具体用于获取初始明文的第一矩阵宽度和第一矩阵高度,将第一矩阵宽度和第一矩阵高度确定为初始明文的第一数据维度;获取业务数据的第二矩阵宽度和第二矩阵高度,将第二矩阵宽度和第二矩阵高度确定为业务数据的第二数据维度;当线性代数运算为标量乘法操作,且第一矩阵高度与第二矩阵宽度相等时,将第一矩阵高度确定为目标数据维度;当线性代数运算为标量乘法操作,且第二矩阵高度与第一矩阵宽度相等时,将第二矩阵高度确定为目标数据维度。
[0026]其中,第一密文包括至少两个子密文;
[0027]上述运算模块,包括:
[0028]第二运算单元,用于获取属于第一参与节点的业务数据对应的数据特征,基于数据特征对至少两个子密文进行聚类,得到一个或多个聚类区间;分别对一个或多个聚类区间中的子密文进行同态加法操作,得到每个聚类区间对应的聚类子密文,将一个或多个聚类子密文确定为第二密文。
[0029]其中,上述预估模块,包括:
[0030]第二获取单元,用于获取初始明文对应的数值范围以及数据维度;
[0031]第二预估单元,用于基于同态加法操作的运算类型、数值范围以及数据维度生成第二密文对应的明文预估界限值。
[0032]其中,上述偏移模块,具体用于获取明文预估界限值中的上限值,对上限值和第二密文进行标量加法操作,得到第三密文;第三密文对应的明文为非负数。
[0033]其中,上述压缩模块,具体用于获取用于表征预估界限值的移位参数,基于移位参数对第三密文进行标量乘法操作,得到至少两个密文单项式;对至少两个密文单项式进行同态加法操作,得到具有多项式格式的目标压缩密文。
[0034]本申请实施例一方面提供了一种基于联邦学习的数据传输装置,包括:
[0035]解密模块,用于第二参与节点接收第一参与节点发送的目标压缩密文,采用私钥对目标压缩密文进行解密处理,得到第一压缩明文;第一参与节本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的数据传输方法,其特征在于,包括:第一参与节点获取第一密文,根据属于所述第一参与节点的业务数据对所述第一密文进行隐私运算,生成第二密文;所述第一密文是指第二参与节点对初始明文进行加密处理所得的数据;所述第二参与节点是指与所述第一参与节点进行联邦学习的节点;对所述第二密文进行数值界限预估,得到所述第二密文对应的明文预估界限值;所述明文预估界限值用于表征所述第二密文对应的明文的数值范围;基于所述明文预估界限值,对所述第二密文进行加法偏移处理,得到第三密文;根据所述明文预估界限值和所述第三密文,生成具有多项式格式的目标压缩密文,发送所述目标压缩密文至所述第二参与节点。2.根据权利要求1所述的方法,其特征在于,所述根据属于所述第一参与节点的业务数据对所述第一密文进行隐私运算,生成第二密文,包括:获取属于所述第一参与节点的业务数据,对所述业务数据和所述第一密文进行线性代数运算,得到第二密文;所述线性代数运算包括标量乘法操作、同态加法操作、标量加法操作中的一种或多种。3.根据权利要求2所述的方法,其特征在于,所述对所述第二密文进行数值界限预估,得到所述第二密文对应的明文预估界限值,包括:获取所述初始明文对应的第一数值范围以及所述业务数据对应的第二数值范围;获取所述初始明文的第一数据维度以及所述业务数据的第二数据维度,根据所述线性代数运算的运算类型,在所述第一数据维度和所述第二数据维度中确定目标数据维度;基于所述线性代数运算的运算类型、所述第一数值范围、所述第二数值范围以及所述目标数据维度,生成所述第二密文对应的明文预估界限值。4.根据权利要求3所述的方法,其特征在于,所述初始明文和所述业务数据均为矩阵;所述获取所述初始明文的第一数据维度以及所述业务数据的第二数据维度,根据所述线性代数运算的运算类型,在所述第一数据维度和所述第二数据维度中确定目标数据维度,包括:获取所述初始明文的第一矩阵宽度和第一矩阵高度,将所述第一矩阵宽度和所述第一矩阵高度确定为所述初始明文的第一数据维度;获取所述业务数据的第二矩阵宽度和第二矩阵高度,将所述第二矩阵宽度和所述第二矩阵高度确定为所述业务数据的第二数据维度;当所述线性代数运算为标量乘法操作,且所述第一矩阵高度与所述第二矩阵宽度相等时,将所述第一矩阵高度确定为目标数据维度;当所述线性代数运算为标量乘法操作,且所述第二矩阵高度与所述第一矩阵宽度相等时,将所述第二矩阵高度确定为目标数据维度。5.根据权利要求1所述的方法,其特征在于,所述第一密文包括至少两个子密文;所述根据属于所述第一参与节点的业务数据对所述第一密文进行隐私运算,生成第二密文,包括:获取属于所述第一参与节点的业务数据对应的数据特征,基于所述数据特征对所述至少两个子密文进行聚类,得到一个或多个聚类区间;分别对所述一个或多个聚类区间中的子密文进行同态加法操作,得到每个聚类区间对
应的聚类子密文,将一个或多个聚类子密文确定为第二密文。6.根据权利要求5所述的方法,其特征在于,所述对所述第二密文进行数值界限预估,得到所述第二密文对应的明文预估界限值,包括:获取所述初始明文对应的数值范围以及数据维度;基于所述同态加法操作的运算类型、所述数值范围以及所述数据维度生成所述第二密文对应的明文预估界限值。7.根据权利要求1所述的方法,其特征在于,所述基于所述明文预估界限值,对所述第二密文进行加法偏移处理,得到第三密文,包括:获取所述明文预估界限值中的上限值,对所述上限值和所述第二密文进行标量加法操作,得到第三密文;所述第三密文对应的明文为非负数。8.根据权利要求1所述的方法,其特征在于,所述根据所述明文预估界限值和所述第三密文,生成具有多项式格式的目标压缩密文,包括:获取用于表征所述预估界限值的移位参数,基于所述移位参数对所述第三密文进行标量乘法操作,得到至少两个密文单项式;对所述至少两个密文单项式进行同态加法操作,得到具有多项式格式的目标压缩密文。9.一种基于联邦学习的数据传输方法,其特征在于,包括:第二参与节点接收第一参与节点发送的目标压缩密文,采用私钥对所述目标压缩密文进行解密处...

【专利技术属性】
技术研发人员:符芳诚蒋杰程勇刘煜宏陈鹏陶阳宇崔斌
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1