实现隐私保护的数据处理方法和装置制造方法及图纸

技术编号:24889201 阅读:27 留言:0更新日期:2020-07-14 18:16
本说明书提供了一种实现隐私保护的数据处理方法和装置,其中,该方法由多个数据持有方执行,多个数据持有方中各数据持有方中存储有各自的隐私样本数据,该方法包括:将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,得到预设明文机器学习模型对应的隐私机器学习模型;执行安全多方计算,以基于各数据持有方中存储的各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。上述方案仅需将明文机器学习模型中的明文算子替换为对应的密码学算子,即可保护隐私样本数据不被泄露,操作方便简单,易用性强。

【技术实现步骤摘要】
实现隐私保护的数据处理方法和装置
本申请涉及数据安全
,特别涉及一种实现隐私保护的数据处理方法和装置。
技术介绍
随着人工神经网络反向传播算法的提出,掀起了机器学习的热潮。机器学习需要大量的样本数据,人们开始担心自己的隐私数据被收集后会被泄露或者是被不正当使用。因此,如何将隐私数据很好地保护起来对未来机器学习至关重要。目前,结合密码学与AI(ArtificialIntelligence,人工智能)能够解决现在数据行业隐私保护的问题。因此,各种基于加密机器学习的框架(例如,TF-Encrypted、PySyft等)应运而生。这些加密机器学习框架与主流AI框架(例如,Tensorflow、PyTorch等)类似,利用了框架API(ApplicationProgrammingInterface,应用程序接口)的易用性,同时通过MPC(SecureMulti-PartyComputation,安全多方计算)和HE(HomomorphicEncryption,同态加密)等多种密码学算法对加密数据进行训练和预测。然而,这些加密机器学习框架在易用性、可扩展性和性能等方面均存在缺陷,特别是易用性将会影响这些加密机器学习框架的推广。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本说明书实施例提供了一种实现隐私保护的数据处理方法和装置,以解决现有技术中的隐私机密机器学习框架的易用性差的问题。本说明书实施例提供了一种实现隐私保护的数据处理方法,由多个数据持有方执行,多个数据持有方中各数据持有方中存储有各自的隐私样本数据,该方法包括:将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,得到预设明文机器学习模型对应的隐私机器学习模型;执行安全多方计算,以基于各数据持有方中存储的各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。在一个实施例中,将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,包括:获取多个密码算子,并对多个密码算子中各密码算子进行注册;获取优化器程序,并对优化器程序进行注册,其中,优化器程序用于将预设明文机器学习模型中的明文算子替换为对应的密码算子。在一个实施例中,优化器程序还用于将预设明文机器学习模型中的明文算子梯度函数替换为对应的密码算子梯度函数;相应地,在获取多个密码算子,并对多个密码算子中各密码算子进行注册之后,还包括:获取多个密码算子中各密码算子对应的密码算子梯度函数,并对各密码算子对应的密码算子梯度函数进行注册;将经注册的密码算子梯度函数与对应的经注册的密码算子进行关联。在一个实施例中,将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,包括:获取安装包文件,其中,安装包文件是基于二进制文件构建的,二进制文件由用于实现多个密码算子的源码、用于实现优化器程序的源码、用于注册多个密码算子的源码和用于注册优化器程序的源码编译后得到,优化器程序在执行时用于将明文模型中的明文算子替换为明文算子对应的密码算子;对安装包文件进行安装;将安装后的文件导入预设明文机器学习模型,以将预设明文机器学习模型中的明文算子替换为对应的密码算子。在一个实施例中,将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,包括:基于预设明文机器学习模型对应的数据流图中的数据流,确定预设明文机器学习模型中需要替换的明文算子;将预设明文机器学习模型中需要替换的明文算子替换为对应的密码算子。在一个实施例中,优化器程序包括以下至少之一:静态优化器程序和动态优化器程序。在一个实施例中,密码算子包括以下至少之一:安全多方计算算子、同态加密算子和零知识证明算子。本说明书实施例还提供了一种实现隐私保护的数据处理装置,位于多个数据持有方中各数据持有方中,多个数据持有方中各数据持有方中存储有各自的隐私样本数据,该装置包括:替换模块,用于将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子,得到预设明文机器学习模型对应的隐私机器学习模型;训练模块,用于执行安全多方计算,以基于各数据持有方中存储的各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。本说明书实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的实现隐私保护的数据处理方法的步骤。本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的实现隐私保护的数据处理方法的步骤。在本说明书实施例中,提供了一种实现隐私保护的数据处理方法,由多个数据持有方执行,各数据持有方中存储有各自的隐私样本数据,各数据持有方通过将预设明文机器学习模型中的明文算子替换为对应的密码算子,得到隐私机器学习模型,之后,多个数据持有方执行安全多方计算,以基于各自的隐私样本数据对隐私机器学习模型进行联合训练,输出目标机器学习模型。上述方案中,仅需将预设明文机器学习模型中的明文算子替换为对应的密码算子,即可得到对应的隐私机器学习模型,之后多个数据持有方执行安全多方计算,即可基于各自的隐私样本数据对隐私机器学习模型进行联合训练,得到目标机器学习模型,因而可以有效保护各个数据持有方的隐私样本数据的隐私。此外,上述方案无需增加其他的应用程序接口,也无需增加其他的隐私数据类型,仅需将明文机器学习模型中的明文算子替换为对应的密码算子,操作方便简单,易用性强。通过上述方案解决了现有的隐私机密机器学习框架的易用性差的技术问题,达到了有效保护数据隐私并提高机器学习框架易用性的技术效果。附图说明此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,并不构成对本说明书的限定。在附图中:图1示出了本说明书一个实施例中实现隐私保护的数据处理方法的应用场景的示意图;图2示出了本说明书一个实施例中的实现隐私保护的数据处理方法的流程图;图3示出了本说明书一个实施例中的实现隐私保护的数据处理方法的框图;图4示出了本说明书一个实施例中的实现隐私保护的数据处理装置的示意图;图5示出了本说明书一个实施例中的计算机设备的示意图。具体实施方式下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域的技术人员知道,本说明书的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。在一个场景示例中,可以在机器学习框架中编写明文机器学习模型。其中,明文机器学习模型中可以包括机器学习框架提供的本地明文算子。本文档来自技高网...

【技术保护点】
1.一种实现隐私保护的数据处理方法,其特征在于,由多个数据持有方执行,所述多个数据持有方中各数据持有方中存储有各自的隐私样本数据,所述方法包括:/n将预设明文机器学习模型中的明文算子替换为所述明文算子对应的密码算子,得到所述预设明文机器学习模型对应的隐私机器学习模型;/n执行安全多方计算,以基于所述各数据持有方中存储的各自的隐私样本数据对所述隐私机器学习模型进行联合训练,输出目标机器学习模型。/n

【技术特征摘要】
1.一种实现隐私保护的数据处理方法,其特征在于,由多个数据持有方执行,所述多个数据持有方中各数据持有方中存储有各自的隐私样本数据,所述方法包括:
将预设明文机器学习模型中的明文算子替换为所述明文算子对应的密码算子,得到所述预设明文机器学习模型对应的隐私机器学习模型;
执行安全多方计算,以基于所述各数据持有方中存储的各自的隐私样本数据对所述隐私机器学习模型进行联合训练,输出目标机器学习模型。


2.根据权利要求1所述的方法,其特征在于,将预设明文机器学习模型中的明文算子替换为所述明文算子对应的密码算子,包括:
获取多个密码算子,并对所述多个密码算子中各密码算子进行注册;
获取优化器程序,并对所述优化器程序进行注册,其中,所述优化器程序用于将预设明文机器学习模型中的明文算子替换为对应的密码算子。


3.根据权利要求2所述的方法,其特征在于,所述优化器程序还用于将预设明文机器学习模型中的明文算子梯度函数替换为对应的密码算子梯度函数;
相应地,在获取多个密码算子,并对所述多个密码算子中各密码算子进行注册之后,还包括:
获取所述多个密码算子中各密码算子对应的密码算子梯度函数,并对所述各密码算子对应的密码算子梯度函数进行注册;
将经注册的密码算子梯度函数与对应的经注册的密码算子进行关联。


4.根据权利要求1所述的方法,其特征在于,将预设明文机器学习模型中的明文算子替换为所述明文算子对应的密码算子,包括:
获取安装包文件,其中,所述安装包文件是基于二进制文件构建的,所述二进制文件由用于实现多个密码算子的源码、用于实现优化器程序的源码、用于注册所述多个密码算子的源码和用于注册所述优化器程序的源码编译后得到,所述优化器程序在执行时用于将所述明文模型中的明...

【专利技术属性】
技术研发人员:陈元丰谢翔晏意林黄高峰史俊杰李升林孙立林
申请(专利权)人:矩阵元技术深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1