基于隐私保护的数据处理方法、装置和服务器制造方法及图纸

技术编号:28473593 阅读:24 留言:0更新日期:2021-05-15 21:41
本说明书提供了基于隐私保护的数据处理方法、装置和服务器。针对分开持有特征数据和标签数据,且一方所持有的标签数据包含多种标签的复杂场景,第一服务器和第二服务器可以先基于秘密分享算法各自计算得到乘积秘密的第一分片矩阵和第二分片矩阵,并分别将上述分片矩阵发送至第三服务器;第三服务器先合并分片矩阵得到乘积秘密的明文数据矩阵,再根据预设的处理规则,对乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,并将从中间结果数据矩阵拆分出的分片矩阵分别提供给第一服务器和第二服务器。从而可以适用标签种类较多的复杂场景,能够在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵。果数据矩阵的分片矩阵。果数据矩阵的分片矩阵。

【技术实现步骤摘要】
基于隐私保护的数据处理方法、装置和服务器


[0001]本说明书属于互联网
,尤其涉及基于隐私保护的数据处理方法、装置和服务器。

技术介绍

[0002]在一些数据处理场景(例如,联合建模场景等)中,有时会存在数据隔离。例如,参与数据处理的一方持有特征数据,另一方持有标签数据,且要求双方在合作进行相关数据处理的不能向对方泄露己方所持有的数据。
[0003]针对上述场景,通常需要在保护各自数据隐私的前提下,先通过合作确定出基于乘积秘密所得到的中间结果数据的分片(例如,基于激励函数得到的share);双方可以利用各自分别持有的中间结果数据的分片,再通过合作,进行进一步的数据处理(例如,模型训练等)。
[0004]但针对一些相对更复杂的场景,例如,其中一方所持有的标签数据所包含的标签种类较多(例如,大于2)的情况,基于上述方法,数据处理过程将会变得较为复杂、繁琐,且难以较好地兼顾数据隐私的保护和处理效率。
[0005]因此,亟需一种能适用于所涉及的标签种类较多,且存在数据隔离的复杂场景,在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵的方法。

技术实现思路

[0006]本说明书提供了一种基于隐私保护的数据处理方法、装置和服务器,以适用于所涉及的标签数据的标签种类较多,且存在数据隔离的复杂场景,能够在保护参与方的数据隐私的前提下,高效地通过合作确定出中间结果数据矩阵的分片矩阵。
[0007]本说明书提供的一种基于隐私保护的数据处理方法、装置和服务器是这样实现的:
[0008]一种基于隐私保护的数据处理方法,应用于第二服务器,包括:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。
[0009]一种基于隐私保护的数据处理方法,应用于第三服务器,包括:响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
[0010]一种基于隐私保护的数据处理方法,应用于第一服务器,包括:接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第一分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第二服务器的乘积秘密的第二分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第一分片矩阵。
[0011]一种基于隐私保护的数据处理装置,包括:第一接收模块,用于接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;处理模块,用于基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;发送模块,用于将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;第二接收模块,用于接收所述中间结果数据矩阵的第二分片矩阵。
[0012]一种基于隐私保护的数据处理装置,包括:生成模块,用于响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收模块,用于接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;处理模块,用于根据预设的处理规则,
对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;发送模块,用于将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。
[0013]一种基于隐私保护的数据处理装置,包括:第一接收模块,用于接收第三服务器响应触发请求生成并发送的第一随机数集;并获取初始模型参数矩阵的第一分片矩阵;处理模块,用于基于秘密分享算法,根据所述第一随机数集、所述初始模型参数矩阵的第一分片矩阵,以及基于所持有的特征数据所构建的特征数据矩阵,与持有标签数据的第二服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护的数据处理方法,应用于第二服务器,包括:接收第三服务器响应触发请求生成并发送的第二随机数集;并获取初始模型参数矩阵的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作,得到关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第二分片矩阵;其中,所述标签数据的种类数大于2;将所述乘积秘密的第二分片矩阵发送至第三服务器;其中,所述第三服务器还接收来自第一服务器的乘积秘密的第一分片矩阵;所述第三服务器合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;所述第三服务器根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;接收所述中间结果数据矩阵的第二分片矩阵。2.根据权利要求1所述的方法,在接收所述中间结果数据矩阵的第二分片矩阵之后,所述方法还包括:基于秘密分享算法,根据所述中间结果数据矩阵的第二分片矩阵和标签数据矩阵,与第一服务器合作,通过联合训练,以得到目标模型。3.根据权利要求1所述的方法,在基于秘密分享算法,根据所述第二随机数集、所述初始模型参数矩阵的第二分片矩阵,以及基于所持有的标签数据所构建的标签数据矩阵,与持有特征数据的第一服务器合作之前,所述方法还包括:对所持有的标签数据进行预设的编码处理,得到与标识信息对应的标签向量;其中,所述标签向量所包含的数据元素的个数等于标签数据的种类数;根据标签向量所对应的标识信息,排列多个标签向量,以构建得到标签数据矩阵。4.根据权利要求1所述的方法,获取初始模型参数矩阵的第二分片矩阵,包括:统计标签数据的种类数;将所述标签数据的种类数发送至第一服务器;接收第一服务器发送的特征数据的种类数;根据所述标签数据的种类数和所述特征数据的种类数,构建初始模型参数矩阵的第二分片矩阵;其中,所述初始模型参数矩阵的第二分片矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数。5.根据权利要求4所述的方法,在统计标签数据的种类数之后,所述方法还包括:将所述标签数据的种类数发送至第三服务器;其中,第三服务器还接收来自第一服务器的特征数据的种类数;所述第三服务器根据所述特征数据的种类数和所述标签数据的种类数,构建初始模型参数矩阵;并将所述初始模型参数矩阵拆分为初始模型参数矩阵的第一分片矩阵和第二分片矩阵;所述初始模型参数矩阵的行数和列数分别等于所述标签数据的种类数和特征数据的种类数;接收第三服务器发送的初始模型参数矩阵的第二分片矩阵。6.根据权利要求1所述的方法,所述方法还包括:
与所述第一服务器合作,确定出当前轮的随机数种子;根据所述当前轮的随机数种子和预设的伪随机数生成器,生成当前轮的伪随机数序列;根据当前轮的伪随机数序列,确定出相对应的当前轮的标识信息序列;根据所述当前轮的标识信息序列,筛选出多个当前轮的标签数据;并对多个当前轮的标签数据进行排序,得到排序后的多个当前轮的标签数据;根据所述排序后的多个当前轮的标签数据,构建当前轮的标签数据矩阵。7.根据权利要求6所述的方法,所述方法还包括:获取上一轮的模型参数矩阵的第二分片矩阵,作为当前轮的初始模型参数的第二分片矩阵;基于秘密分享算法,根据所述第二随机数集、所述上一轮的模型参数矩阵的第二分片矩阵,与持有特征数据的第一服务器合作,得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵。8.根据权利要求7所述的方法,在得到关于当前轮的特征数据矩阵与上一轮的模型参数矩阵的当前轮的乘积秘密的第二分片矩阵之后,所述方法还包括:将所述当前轮的乘积秘密的第二分片矩阵发送至第三服务器;接收第三服务器发送的当前轮的中间结果数据矩阵的第二分片矩阵;基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵,以及当前轮的标签数据矩阵,与第一服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵。9.根据权利要求8所述的方法,基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第一分片矩阵,以及当前轮的标签数据矩阵,与第二服务器合作,通过联合训练得到当前轮的模型参数矩阵的第二分片矩阵,包括:基于秘密分享算法,根据所述当前轮的中间结果数据矩阵的第二分片矩阵、当前轮的标签数据矩阵,与第一服务器进行第一类合作,以得到当前轮的模型梯度数据矩阵的第二分片矩阵;基于秘密分享算法,根据所述当前轮的模型梯度数据矩阵的第二分片矩阵、上一轮的模型参数矩阵的第二分片矩阵,与第一服务器进行第二类合作,以得到当前轮的模型参数矩阵的第二分片矩阵;其中,所述第一服务器得到当前轮的模型参数矩阵的第一分片矩阵。10.一种基于隐私保护的数据处理方法,应用于第三服务器,包括:响应触发请求,生成第一随机数集和第二随机数集,并将所述第一随机数集发送至第一服务器,将所述第二随机数集发送至第二服务器;其中,所述第一服务器持有特征数据,所述第二服务器持有标签数据,所述标签数据的种类数大于2;接收关于特征数据矩阵与初始模型参数矩阵的乘积秘密的第一分片矩阵和第二分片矩阵;并合并所述乘积秘密的第一分片矩阵和第二分片矩阵,得到所述乘积秘密的明文数据矩阵;根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵;并将所述中间结果数据矩阵拆分为中间结果数据矩阵的第一分片矩阵和中间结果数据矩阵的第二分片矩阵;
将所述中间结果数据矩阵的第一分片矩阵发送至第一服务器;将所述中间结果数据矩阵的第二分片矩阵发送至第二服务器。11.根据权利要求10所述的方法,根据预设的处理规则,对所述乘积秘密的明文数据矩阵进行相应的softmax处理,得到中间结果数据矩阵,包括:根据预设的处理规则,将所述乘积秘密的明文数据矩阵按列拆分成按顺序排列的多个第一向量;对所述多个第一向量分别进行softmax处理,...

【专利技术属性】
技术研发人员:周亚顺尹栋李漓春
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1