【技术实现步骤摘要】
两方泊松回归隐私计算模型训练方法、装置和存储介质
[0001]本专利技术涉及模型训练领域,具体涉及一种两方泊松回归隐私计算模型训练方法、装置和计算机可读存储介质。
技术介绍
[0002]隐私计算全称是“保护数据隐私的计算”,或“隐私保护计算”(Privacy Preserving Computation),是指在多个参与方进行联合计算的时候,在保证各方数据安全与隐私不泄露的前提下,实现计算与数据价值挖掘的技术体系。隐私计算能够在各方明文数据无需出库的情况下,完成各方数据的融合计算、联合建模的等数据应用,在满足数据隐私安全的基础上,实现数据“价值”和“知识”的流动与共享,真正做到“数据可用不可见”。目前隐私计算领域在应用层面最受广泛关注的领域是联邦学习和基于MPC(Secure Muti
‑
party Computation,安全多方计算)的机器学习方法。在实现本专利技术过程中,申请人发现现有技术中至少存在如下问题:在对事件的“计数”进行建模时,需要可信第三方,或者不需要第三方时加密复杂,通信频繁。
【技术保护点】
【技术特征摘要】
1.一种两方泊松回归隐私计算模型训练方法,应用于标签方,其特征在于,包括:向数据源方发起两方泊松回归隐私计算初始模型训练的请求;其中,所述两方泊松回归隐私计算初始模型内包含用于衡量计数的变量;对两方泊松回归隐私计算初始模型进行模型迭代训练,直至满足所述两方泊松回归隐私计算初始模型的收敛条件,得到训练完毕的两方泊松回归隐私计算模型;所述两方泊松回归隐私计算模型用于与训练数据所属场景的相同场景中事件的计数进行预测;其中,每次对所述两方泊松回归隐私计算初始模型进行模型迭代训练时,属于标签方的具体步骤包括:步骤11、根据所持有的样本变量与标签方模型训练参数进行计算得到标签方本地模型结果;其中,所述标签方本地模型结果采用第一公钥进行加密,所述第一公钥属于数据源方生成的用于同态加密的第一密钥对;首次采用的所述标签方模型训练参数为标签方模型训练初始参数;接收所述数据源方根据数据源方模型训练参数与其所持有的本地样本变量在本地生成的数据源方本地模型结果,所述数据源方本地模型结果采用所述第一公钥进行加密;其中,首次采用的数据源方模型训练参数为数据源方模型训练初始参数;步骤12、将标签方采用第一公钥加密的本地模型结果和数据源方采用第一公钥加密的本地模型结果相乘,得到采用第一公钥加密的预测值;根据所述预测值计算得到加密的残差,并加密的残差同步给数据源方;步骤13、在所述数据源方的配合下通过所述残差计算标签方参数梯度,通过所述标签方参数梯度调整所述标签方模型训练参数,实现所述两方泊松回归隐私计算初始模型训练的迭代计算;步骤14、配合所述数据源方通过所述残差计算数据源方参数梯度,所述数据源方参数梯度用于所述数据源方在本地调整数据源方模型训练参数,实现所述两方泊松回归隐私计算初始模型训练的迭代计算。2.根据权利要求1所述的两方泊松回归隐私计算模型训练方法,其特征在于,还包括:步骤15、在向数据源方发起两方泊松回归隐私计算初始模型训练的请求之前,所述标签方生成用于同态加密的第二密钥对,所述第二密钥对包括第二公钥和第二私钥;接收数据源方发送的第一公钥;步骤12中,所述根据所述预测值计算得到加密的残差,具体包括:计算所述预测值与真实标签值之差,得到整体线性结果的偏导,在泊松回归中计算整体线性结果的偏导,泊松回归中计算整体线性结果的偏导等于残差;步骤13中,所述在所述数据源方的配合下通过所述残差计算标签方参数梯度,通过所述标签方参数梯度调整标签方模型训练参数,具体包括:采用所述残差进行计算得到标签方参数梯度,将所述标签方参数梯度加密,得到以标签方加密的标签方参数梯度,并发送给所述数据源方;接收所述数据源方发送的以标签方加密的标签方参数梯度;将所述标签方参数梯度解密后,通过解密后的所述参数梯度调整标所述签方模型训练参数。3.根据权利要求2所述的两方泊松回归隐私计算模型训练方法,其特征在于,所述的将
标签方参数梯度加密得到以标签方加密的标签方参数梯度,具体包括:生成第二随机掩码,将所述第二随机掩码加入标签方参数梯度形成加盐的标签方参数梯度;步骤13中,所述在所述数据源方的配合下通过所述残差计算标签方参数梯度,通过标签方参数梯度调整标签方模型训练参数,具体包括:将所述加盐的标签方参数梯度发送给所述数据源方;接收所述数据源方解密的标签方参数梯度;其中,所述数据源方接收到加盐的标签方参数梯度后,采用第一私钥对所述加盐的标签方参数梯度进行解密,得到加盐的标签方参数梯度;将加盐的参数梯度内的第二随机掩码去掉,得到标签方参数梯度的明文;根据标签方参数梯度的明文调整所述标签方模型训练参数。4.根据权利要求2所述的两方泊松回归隐私计算模型训练方法,其特征在于,步骤14具体包括:对所述残差进行加密,将加密的残差发送给所述数据源方;接收数据源方发送的加密的数据源方参数梯度;其中,所述数据源方发送的加密的所述数据源方参数梯度通过如下方法得到:所述数据源方在接收到所述加密的残差后,采用第一私钥对所述加密的残差进行解密得到标签方加密的残差,采用所述标签方加密的残差进行计算得到所述数据源方参数梯度,对所述数据源方参数梯度进行加密得到加密的数据源方参数梯度,将所述加密的数据源方参数梯度发给所述标签方;对加密的数据源方参数梯度进行解密,发送给数据源方;其中,发送给数据源方的数据源方参数梯度被数据源方采用第一私钥对数据源方参数梯度进行解密,得到数据源方参数梯度的明文,通过所述数据源方参数梯度的明文调整数据源方模型训练参数。5.根据权利要求4所述的两方泊松回归隐私计算模型训练方法,其特征在于,步骤12中,在所述将加密的残差同步给数据源方之前,还包括:标签方生成第一随机掩码,采用第二公钥对第一随机掩码进行加密第一盐,将第一盐加入所述残差得到加盐的残差;步骤14中,将加密的残差发送给所述数据源方,具体包括:将所述加盐的残差发送给数据源方;接收所述数据源方发送的加盐的数据源方参数梯度,采用所述第二私钥对加盐的数据源方参数梯度进行解密,发送给所述数据源方。6.一种两方泊松回归隐私计算模型训练方法,应用于数据源方,其特征在于,包括:接收标签方发起的两方泊松回归隐私计算初始模型训练的请求;其中,所述两方泊松回归隐私计算初始模型内包含用于衡量计数的变量;对两方泊松回归隐私计算初始模型进行模型迭代训练,直至满足模型的收敛条件,得到训练完毕的两方泊松回归隐私计算模型;所述两方泊松回归隐私计算模型用于与训练数据所属场景的相同场景中事件的计数进行预测;其中,每次对两方泊松回归隐私计算初始模型进行模型迭代训练时,属于数据源方的具体步骤包括:步骤21、根据数据源方模型训练参数与其所持有的本地样本数据,在本地生成数据源方本地模型结果,将所述数据源方本地模型结果发送给所述标签方;其中,所述数据源方本
地模型结果采用第一私钥进行加密,所述第一私钥属于所述数据源方生成的用于同态加密的第一密钥对;首次采用的所述数据源方模型训练参数为数据源方模型训练初始参数;步骤22、接收所述标签方同步给到的残差之后,配合所述标签方通过所述残差计算标签方参数梯度,所述标签方参数梯度用于调整标签方模型训练参数,实现两方泊松回归隐私计算初始模型训练迭代计算;步骤23、当接收所述标签方同步给到的残差之后,在所述标签方的配合下通过所述残差计算数据源方参数梯度,所述数据源方参数梯度用于所述数据源方在本地调整数据源方模型训练参数,实现两方泊松回归隐私计算初始模型训练迭代计算。7.根据权利要求6所述的两方泊松回归隐私计算模型训练方法,其特征在于,还包括:步骤24、在接收标签方发起的两方泊松回归隐私计算初始模型训练的请求之前,生成用于同态加密的第一密钥对,所述第一密钥对包括第一公钥和第一私钥,并将第一公钥发送给标签方;接收所述标签方发送的第二公钥;所述第二公钥属于所述标签方生成的同态加密的第二密钥对,所述第二密钥对包括第二公钥和第二私钥;步骤23中,所述当接收所述标签方同步给到的残差之后,在所述标签方的配合下通过所述残差计算数据源方参数梯度,所述数据源方参数梯度用于所述数据源方在本地调整数据源方模型训练参数,实现两方,具体包括:接收标签方同步给到的加密的残差,采用第一私钥对所述加密的残差进行解密,得到标签方加密的残差;其中,标签方发送的加密的残差通过如下方法得到:标签方计算所述预测值与真实标签值之差,得到整体线性结果的偏导,在泊松回归中计算整体线性结果的偏导,泊松回归中计算整体线性结果的偏导等于残差;并对所述残差进行加密,得到加密的残差;采用所述标签方加密的残差进行计算得到所述数据源方参数梯度,对所述数据源方参数梯度进行加密得到加密的数据源方参数梯度,并将所述加密的数据源方参数梯度发送给所述标签方;接收所述标签方发送的采用所述第一公钥加密的数据源方参数梯度,采用第一私钥对所述加密的数据源方参数梯度进行解密,得到数据源方参数梯度的明文,通过所述数据源方参数梯度的明文调整所述数据源方模型训练参数;其中,所述标签方发送的采用所述第一公钥加密的数据源方参数梯度通过如下方法得到:所述标签方对所述数据源方参数梯度进行解密,得到加盐的数据源方参数梯度。8.根据权利要求7所述的两方泊松回归隐私计算模型训练方法,其特征在于,步骤23具体包括:所述采用标签方加密的残差进行计算接收标签方发送的加盐的残差;其中,标签方发送的加盐的残差,具体包括:标签方生成第一随机掩码,采用第二公钥对第一随机掩码进行加密得到第一盐,将第一盐加入残差得到加盐的残差;采用所述第一私钥对所述加盐的残差进行解密,得到采用第二公钥进行加密的残差,采用所述采用第二公钥进行加密的残差进行计算得到所述数据源方参数梯度,将所述数据源方参数梯度进行加密得到加密的数据源方参数梯度;其中,所述的将所述数据源方参数梯度进行加密,包括:生成第三随机数作为第三随机掩码,将所述第三随机掩码加入数据源方...
【专利技术属性】
技术研发人员:赵珙炜,薛瑞东,田健,
申请(专利权)人:北京融数联智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。