System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多主体数据联合方法、系统、服务器和终端设备技术方案_技高网

多主体数据联合方法、系统、服务器和终端设备技术方案

技术编号:40563247 阅读:9 留言:0更新日期:2024-03-05 19:26
本公开提出了一种多主体数据联合方法、系统、服务器和终端设备,原始数据分布在K个数据拥有方中,原始数据包括工具变量、暴露因素和结局变量,方法包括:K个数据拥有方利用第一加密密钥对自身的工具变量和暴露因素进行加密;接收加密后的工具变量和暴露因素并得到第一回归系数;K个数据拥有方利用第一回归系数和自身的工具变量得到自身暴露因素的预测值,并利用第二加密密钥对预测值和结局变量进行加密;接收加密后的预测值和结局变量并得到第二回归系数;K个数据拥有方对第二回归系数进行解密,得到原始数据中暴露因素的预测值与结局变量之间的回归系数。由此,在保证数据隐私的前提下,实现跨机构共享、融合数据,完成孟德尔随机化分析。

【技术实现步骤摘要】

本公开涉及数据处理,尤其涉及一种多主体数据联合方法、系统、服务器和终端设备


技术介绍

1、训练机器学习模型的数据常常被不同的组织、机构所有,尤其是具有极强隐私性的基因组学数据。由于数据安全、用户隐私等方面原因,这些数据不能被简单聚合在一起进行训练或使用。由于法律政策监管、数据隐私安全等方面的顾虑,各数据所有者也不愿直接交换原始数据,从而导致数据无法有效汇聚,影响机器学习的效果,制约着ai模型的提高。在基因组学领域,各方持有的基因组数据就更有限了,要促进更好的数据挖掘,需要大量的样本进行聚合后联合分析。而各方基因组数据如何在保证数据不泄露的前提下联合多个数据所有方进行联合训练机器学习模型就成了如今数据开放共享、释放数据价值的一大挑战。


技术实现思路

1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本公开的一个目的在于提出一种多主体数据联合方法,以在保证数据隐私的前提下,实现跨机构共享、融合数据,完成孟德尔随机化分析。

2、本公开的第二个目的在于提出另一种多主体数据联合方法。

3、本公开的第三个目的在于提出一种服务器。

4、本公开的第四个目的在于提出一种终端设备。

5、本公开的第五个目的在于提出一种多主体数据联合系统。

6、为达到上述目的,本公开第一方面实施例提出了一种多主体数据联合方法,原始数据分布在k个数据拥有方中,k为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:生成第一加密密钥和第二加密密钥;将所述第一加密密钥发送至所述k个数据拥有方,以使所述k个数据拥有方利用所述第一加密密钥对自身的工具变量和暴露因素进行加密;接收所述k个数据拥有方发送的加密后的工具变量和暴露因素,并根据所述k个数据拥有方发送的加密后的工具变量和暴露因素得到第一回归系数;将所述第一回归系数和所述第二加密密钥发送至所述k个数据拥有方,以使所述k个数据拥有方利用所述第一回归系数和自身的工具变量得到自身暴露因素的预测值,并利用所述第二加密密钥对自身暴露因素的预测值和结局变量进行加密;接收所述k个数据拥有方发送的加密后的预测值和结局变量,并根据所述k个数据拥有方发送的加密后的预测值和结局变量得到第二回归系数;将所述第二回归系数发送至所述k个数据拥有方,以使所述k个数据拥有方对所述第二回归系数进行解密,得到所述原始数据中暴露因素的预测值与结局变量之间的回归系数。

7、本公开实施例的多主体数据联合方法,由服务器生成第一加密密钥和第二加密密钥,并将第一加密密钥发送给k个数据拥有方,k个数据拥有方利用第一加密密钥对自身的工具变量和暴露因素进行加密;服务器接收加密后的工具变量和暴露因素,并利用加密后的工具变量和暴露因素得到第一回归系数;k个数据拥有方利用第一回归系数和自身的工具变量得到自身暴露因素的预测值,并利用第二加密密钥对自身暴露因素的预测值和结局变量进行加密;服务器接收加密后的预测值和结局变量,并利用加密后的预测值和结局变量得到第二回归系数;k个数据拥有方对第二回归系数进行解密,得到原始数据中暴露因素的预测值与结局变量之间的回归系数。该方法能够在保证数据隐私的前提下,实现跨机构共享、融合数据,完成孟德尔随机化分析。

8、另外,根据本公开上述实施例提出的多主体数据联合方法还可以具有如下附加的技术特征:

9、根据本公开的一个实施例,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述将所述第一加密密钥和所述第二加密密钥发送至各所述数据拥有方之前,所述方法还包括:根据每个数据拥有方的原始数据数量,将所述第一随机正交矩阵切分成k个第一子矩阵和将所述第二随机正交矩阵切分成k个第二子矩阵;其中,所述将所述第一加密密钥和所述第二加密密钥发送至所述k个数据拥有方,包括:将所述k个第一子矩阵和所述k个第二子矩阵发送至对应的数据拥有方,并将所述第一随机种子和所述第二随机种子分别发送至所述k个数据拥有方。

10、根据本公开的一个实施例,通过下式得到第一回归系数:

11、

12、其中,为所述第一回归系数,g′=g′1+g′2+…+g′k+…+g′k,x′=x′1+x′2+…+x′k+…+x′k,g′k为第k个数据拥有方加密后的工具变量,x′k为第k个数据拥有方加密后的暴露因素。

13、根据本公开的一个实施例,通过下式得到第二回归系数:

14、

15、其中,为所述第二回归系数,为第k个数据拥有方加密后的预测值,y′k为第k个数据拥有方加密后的结局变量。

16、为达到上述目的,本公开第二方面实施例提出了另一种多主体数据联合方法,原始数据分布在k个数据拥有方中,k为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:接收服务器发送的第一加密密钥和第二加密密钥,并利用所述第一加密密钥对自身的工具变量和暴露因素进行加密;将加密后的工具变量和暴露因素发送至所述服务器,以使所述服务器根据所述k个数据拥有方发送的加密后的工具变量和暴露因素得到第一回归系数;接收所述服务器发送的所述第一回归系数,并对所述第一回归系数进行解密;利用解密后的第一回归系数和自身的工具变量得到自身暴露因素的预测值,以及利用所述第二加密密钥对自身暴露因素的预测值和结局变量进行加密;将加密后的预测值和结局变量发送至所述服务器,以使所述服务器根据所述k个数据拥有方发送的加密后的预测值和结局变量得到第二回归系数;接收所述服务器发送的所述第二回归系数,并对所述第二回归系数进行解密,得到所述原始数据中暴露因素的预测值与结局变量之间的回归系数。

17、另外,根据本公开上述实施例提出的多主体数据联合方法还可以具有如下附加的技术特征:

18、根据本公开的一个实施例,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述服务器根据每个数据拥有方的原始数据数量,将所述第一随机正交矩阵切分成k个第一子矩阵和将所述第二随机正交矩阵切分成k个第二子矩阵,并将所述k个第一子矩阵和所述k个第二子矩阵发送至对应的数据拥有方,将所述第一随机种子和所述第二随机种子分别个送至所述k个数据拥有方,其中,所述利用所述第一加密密钥对自身的工具变量和暴露因素进行加密,包括:根据所述第一随机种子生成第三正交矩阵,并通过下式对自身的工具变量和暴露因素进行加密:

19、

20、x′k=kxk,

21、其中,g′k为第k个数据拥有方加密后的工具变量,gk为第k个数据拥有方原始数据中的工具变量,x′k为第k个数据拥有方加密后的暴露因素,xk为第k个数据拥有方原始数据中的暴露因素,pk为所述第k个数据拥有方对应的第一子矩阵,q为所述第三正交矩阵。

22、根据本公开的一个实施例,所述利用所述第二加密密钥对自身暴露因素的预测值和结局变量进行加密,本文档来自技高网...

【技术保护点】

1.一种多主体数据联合方法,其特征在于,原始数据分布在K个数据拥有方中,K为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:

2.根据权利要求1所述的多主体数据联合方法,其特征在于,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述将所述第一加密密钥和所述第二加密密钥发送至各所述数据拥有方之前,所述方法还包括:

3.根据权利要求1所述的多主体数据联合方法,其特征在于,通过下式得到第一回归系数:

4.根据权利要求1所述的多主体数据联合方法,其特征在于,通过下式得到第二回归系数:

5.一种多主体数据联合方法,其特征在于,原始数据分布在K个数据拥有方中,K为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:

6.根据权利要求5所述的多主体数据联合方法,其特征在于,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述服务器根据每个数据拥有方的原始数据数量,将所述第一随机正交矩阵切分成K个第一子矩阵和将所述第二随机正交矩阵切分成K个第二子矩阵,并将所述K个第一子矩阵和所述K个第二子矩阵发送至对应的数据拥有方,将所述第一随机种子和所述第二随机种子分别个送至所述K个数据拥有方,其中,所述利用所述第一加密密钥对自身的工具变量和暴露因素进行加密,包括:

7.根据权利要求6所述的多主体数据联合方法,其特征在于,所述利用所述第二加密密钥对自身暴露因素的预测值和结局变量进行加密,包括:

8.根据权利要求7所述的多主体数据联合方法,其特征在于,利用所述第三正交矩阵对所述第一回归系数进行解密,利用所述第四正交矩阵对所述第二回归系数进行解密。

9.根据权利要求5所述的多主体数据联合方法,其特征在于,在将加密后的工具变量和暴露因素发送至所述服务器之前,所述方法还包括:

10.一种服务器,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-4中任一项所述的多主体数据联合方法。

11.一种终端设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求5-9中任一项所述的多主体数据联合方法。

12.一种多主体数据联合系统,其特征在于,所述系统包括:如权利要求10所述的服务器和K个如权利要求11所述的终端设备,其中,K为大于等于2的整数。

...

【技术特征摘要】

1.一种多主体数据联合方法,其特征在于,原始数据分布在k个数据拥有方中,k为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:

2.根据权利要求1所述的多主体数据联合方法,其特征在于,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述将所述第一加密密钥和所述第二加密密钥发送至各所述数据拥有方之前,所述方法还包括:

3.根据权利要求1所述的多主体数据联合方法,其特征在于,通过下式得到第一回归系数:

4.根据权利要求1所述的多主体数据联合方法,其特征在于,通过下式得到第二回归系数:

5.一种多主体数据联合方法,其特征在于,原始数据分布在k个数据拥有方中,k为大于等于2的整数,所述原始数据包括工具变量、暴露因素和结局变量,所述方法包括:

6.根据权利要求5所述的多主体数据联合方法,其特征在于,所述第一加密密钥包括第一随机正交矩阵和第一随机种子,所述第二加密密钥包括第二随机正交矩阵和第二随机种子,所述服务器根据每个数据拥有方的原始数据数量,将所述第一随机正交矩阵切分成k个第一子矩阵和将所述第二随机正交矩阵切分成k个第二子矩阵,并将所述k个第一子矩阵和所述k个第二子矩阵发送至对应的数据拥有方,...

【专利技术属性】
技术研发人员:杨梦张楚文李士森陈世文
申请(专利权)人:深圳华大智造科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1