数据同态加密推理系统及方法技术方案

技术编号:36774610 阅读:13 留言:0更新日期:2023-03-08 21:57
本申请公开了一种数据同态加密推理系统及方法,由数据方生成同态加密的秘钥,采用公钥对待推理数据进行同态加密后发送给评估方,将公钥发送给模型方,模型方采用公钥对预训练的数据推理模型的模型参数进行同态加密,并将加密模型参数发送给评估方。由于数据是加密后发送给评估方,因此其余各方均无法获取到自身的隐私数据,保证了数据隐私安全。借助同态加密技术的特性,评估方可以利用加密模型参数对加密数据进行加密推理,得到的加密推理结果与明文推理结果相同,将加密推理结果反馈给数据方进行解密,得到明文推理结果。进一步,本申请利用独立的评估方进行加密推理计算,可以借用评估方的高算力服务,保证加密推理计算的可靠性。性。性。

【技术实现步骤摘要】
数据同态加密推理系统及方法


[0001]本申请涉及联邦学习
,更具体的说,是涉及一种数据同态加密推理系统及方法。

技术介绍

[0002]随着人工智能相关技术的日益成熟,研究人员和相关从业者常通过使用神经网络实现一些推理任务。但是这种方法通常建立在大规模的数据喂养上,随着公众和法律法规越来越重视对隐私数据的保护,如何在兼顾隐私安全的前提下打破数据孤岛成为了一个重要的问题。
[0003]现有的隐私安全的解决方法有:差分隐私(Differential Privacy,DP),多方安全计算(Multi

party Security Calculation,MPC)。其中差分隐私通常采用随机采样或添加噪声来对用户的输入输出数据进行扰动,从而在一定程度上可以对抗隐私分析,这一方法虽然易于实现但是会导致模型性能出现明显下降;而MPC由于不会对计算过程进行扰动,因此可以保证数据的准确性和安全性,但是MPC需要更高的计算量和网络带宽吞吐量。

技术实现思路

[0004]鉴于上述问题,提出了本申请以便提供一种数据同态加密推理系统及方法,以解决传统神经网络推理过程未考虑数据隐私安全,容易遭受不诚实用户攻击,而现有的隐私安全解决方案容易存在降低模型性能或需要较大的计算量和网络带宽吞吐量的问题。具体方案如下:
[0005]第一方面,提供了一种数据同态加密推理系统,包括:数据方、模型方和评估方;
[0006]所述数据方,用于生成同态加密的公钥和私钥对,采用所述公钥对待推理数据进行同态加密,得到加密数据,将所述公钥发送给所述模型方,以及,将所述加密数据发送给所述评估方;
[0007]所述模型方,用于采用所述公钥对预训练的数据推理模型的模型参数进行同态加密,得到加密模型参数,并将所述加密模型参数发送给所述评估方,其中,所述数据推理模型为用于对所述待推理数据进行推理的神经网络模型;
[0008]所述评估方,用于采用所述加密模型参数对所述加密数据进行加密推理,得到加密推理结果,并反馈给所述数据方;
[0009]所述数据方,还用于采用所述私钥对所述加密推理结果进行解密,得到明文推理结果。
[0010]第二方面,提供了一种数据同态加密推理方法,应用于模型方,方法包括:
[0011]接收数据方发送的公钥;
[0012]采用所述公钥对预训练的数据推理模型的模型参数进行同态加密,得到加密模型参数,其中,所述数据推理模型为用于对数据方的待推理数据进行推理的神经网络模型;
[0013]将所述加密模型参数发送给评估方,以供评估方采用所述加密模型参数对所述数
据方提供的加密数据进行加密推理,并将加密推理结果反馈给数据方,其中,所述加密数据为所述数据方采用所述公钥对待推理数据进行同态加密后生成。
[0014]借由上述技术方案,本申请将同态加密技术应用于神经网络推理任务中,同态加密支持对密文进行数学运算,并且计算结果解密后与明文计算结果相同。本申请提供的系统涉及三个参与方,分别为提供待推理数据的数据方、提供数据推理模型的模型方,以及实现加密推理任务的评估方。由数据方生成同态加密的公私钥对后,采用公钥对待推理数据进行同态加密后发送给评估方,并将公钥发送给模型方,模型方采用公钥对预训练的数据推理模型的模型参数进行同态加密,并将加密模型参数发送给评估方。由于数据方和模型方均是通过同态加密对各自的隐私数据进行加密后发送给评估方,因此除自身之外其余各方均无法获取到自身的隐私数据,保证了数据隐私安全。并且,借助同态加密技术的特性,评估方可以利用加密模型参数对加密数据进行加密推理,得到的加密推理结果与明文推理结果相同,保证了推理任务的准确实施,在此基础上,将加密推理结果反馈给数据方,由数据方利用私钥进行解密,得到明文推理结果。采用本申请方案,解决了传统神经网络推理过程未考虑数据隐私安全,容易遭受不诚实用户攻击的问题,同时,保证了数据推理模型的性能。
[0015]进一步地,考虑到在利用加密模型参数对加密数据进行加密推理过程,也会消耗一定的计算开销,因此本申请将实现加密推理计算的过程单独的放在评估方执行,评估方可以是云端或其他拥有高算力的服务器等,保证加密推理计算的可靠性。
附图说明
[0016]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0017]图1为本申请实施例提供的一种数据同态加密推理信令交互图;
[0018]图2示例了一种基因型向量数据转换为特征图的过程示意图;
[0019]图3为本申请实施例提供的另一种数据同态加密推理信令交互图;
[0020]图4示例了一种数据方加密数据过程示意图;
[0021]图5示例了一种模型方加密模型参数过程示意图;
[0022]图6示例了一种数据方解密过程示意图;
[0023]图7为本申请实施例提供的一种数据同态加密方法流程示意图。
具体实施方式
[0024]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025]本申请提供了一种数据同态加密推理系统,可以适用于各种涉及数据隐私安全的推理任务,通过采用同态加密技术对各参与方的隐私数据进行同态加密,既能够保证隐私数据的安全,又可以保证推理结果的准确性。同时,通过单独设置的评估方进行加密推理计
算,可以利用评估方强大的算力保证加密推理计算结果的可靠性。
[0026]本申请方案可以适用于针对生物、医疗、金融等隐私数据进行加密推理的场景。以基因型表型数据预测任务为例,其是指从高通量基因型数据中预测表型数据,如预测表型信息和疾病风险等。其中,基因型数据和表型数据都是敏感的隐私数据。
[0027]接下来,结合图1所示的数据同态加密推理信令交互图,对本申请的数据同态加密推理系统中各方功能进行介绍:
[0028]本申请的数据同态加密推理系统包括数据方A、模型方B和评估方C。
[0029]其中,数据方A,用于生成同态加密的公钥和私钥对,采用公钥对待推理数据进行同态加密,得到加密数据,将公钥发送给模型方,以及,将加密数据发送给评估方。
[0030]其中,公钥用于对数据方待推理的明文数据进行加密,以及,供模型方对预训练的数据推理模型的模型参数进行加密。私钥仅保存在数据方本地,用于对加密推理结果进行解密。
[0031]数据方A可以在本地使用秘钥生成算法生成公钥和私钥,且只将公钥发送给模型方B,因此模型方B和评估方C均无法窃取数据方A的隐私数据。
[0032]数据方A向模型方B本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据同态加密推理系统,其特征在于,包括:数据方、模型方和评估方;所述数据方,用于生成同态加密的公钥和私钥对,采用所述公钥对待推理数据进行同态加密,得到加密数据,将所述公钥发送给所述模型方,以及,将所述加密数据发送给所述评估方;所述模型方,用于采用所述公钥对预训练的数据推理模型的模型参数进行同态加密,得到加密模型参数,并将所述加密模型参数发送给所述评估方,其中,所述数据推理模型为用于对所述待推理数据进行推理的神经网络模型;所述评估方,用于采用所述加密模型参数对所述加密数据进行加密推理,得到加密推理结果,并反馈给所述数据方;所述数据方,还用于采用所述私钥对所述加密推理结果进行解密,得到明文推理结果。2.根据权利要求1所述的系统,其特征在于,所述待推理数据为待推理对应表型数据的基因型向量数据,所述数据推理模型为用于处理基因型表型数据推理的神经网络模型;所述模型方预先训练数据推理模型的过程,包括:将作为训练样本的基因型向量数据转换为特征图;采用所述特征图对数据推理模型进行明文训练,得到训练后的数据推理模型。3.根据权利要求2所述的系统,其特征在于,所述模型方将作为训练样本的基因型向量数据转换为特征图的过程,包括:将作为训练样本的每条基因型向量数据按行切分,将切分后的各行按照从上至下顺序排列成特征矩形图。4.根据权利要求2所述的系统,其特征在于,所述模型方将作为训练样本的基因型向量数据转换为特征图之前,还用于:采用带惩罚项的基模型,对作为训练样本的基因型向量数据中各维度特征进行筛选,得到降维后的基因型向量数据作为训练样本。5.根据权利要求1所述的系统,其特征在于,所述模型方预训练的数据推理模型中,采用平方激活函数作为非线性激活函数。6.根据权利要求1所述的系统,其特征在于,所述模型方在采用所述公钥对所述数据推理模型的模型参数进行同态加密之前,还用于:将所述数据推理模型的模型参数进行静态量化,得到静态量化后的模型参数,并将静态量化所使用的量化因子发送至所述评估方,所述量化因子包括放缩因子和零点;则模型方采用所述公钥对所述数据推理模型的模型参数进行同态加密的过程,包括:采用所述公钥对所述静态量化...

【专利技术属性】
技术研发人员:李昊束柬王金钖陈剑波戈力徐生姜佳华
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1