当前位置: 首页 > 专利查询>暨南大学专利>正文

一种岭回归训练方法、计算设备、介质技术

技术编号:21572146 阅读:28 留言:0更新日期:2019-07-10 15:33
本发明专利技术公开了一种岭回归训练方法,包括步骤:参数初始化,生成系统公共参数,生成各参与方的公私钥对,计算重加密密钥;接收训练请求时,计算联合公钥,用联合公钥加密私有数据,生成密文一;利用两阶段的解密机制,结合密文重加密技术,对密文一进行部分解密和重加密,生成密文二;通过DR对密文二进行解密,得到模型的最终训练结果。本发明专利技术用到ElGamal加法变体方案,结合密文重加密技术,保证数据资源在合作过程中的机密性的同时精简计算,提高计算速度的同时降低计算成本。

A Ridge Regression Training Method, Computing Equipment and Media

【技术实现步骤摘要】
一种岭回归训练方法、计算设备、介质
本专利技术涉及数据安全与隐私保护领域,特别涉及一种基于多源数据隐私保护的岭回归训练方法、计算设备、介质。
技术介绍
近年来,大数据技术和人工智能正处于高速发展阶段,我们在日常生活中无时无刻不享受着大数据技术所带来的便利。然而,在享受这些便利的同时,伴随的是用户隐私数据的泄露,这些数据在无形之中被各企业所共享,换言之,我们其实是在牺牲隐私换取便利。用户隐私数据的泄露将会给用户造成很大的困扰,在大数据时代也愈发重视保护个人数据的隐私。常用的数据安全技术便是加密技术,将用户的私有数据加密后再存储在云端,数据加密技术能够防止数据的泄露,然而,普通的加密技术只能保证数据不会被泄露出去,却丧失了数据的可用性。机器学习需要大量数据来训练更准确的模型,也就意味着用户经常需要把与个人隐私相关的数据上传到机器学习云服务器上进行训练,这就是正在大肆兴起的机器学习即服务(MLaaS)。目前,云服务提供商在MLaas方面发展迅速,但所有的训练数据都必须透露给执行该服务的操作人员,这个过程往往不能保证数据不会被第三方利用。在密码学领域,同态加密和安全多方计算等密文计算方法为解决这个难题提供了一种有效的解决思路,利用同态密码学技术能够在加密的数据上执行一定的运算操作,并且等同于在明文上进行操作,即能够利用同态密码学构造在密文上训练机器学习模型的协议。但值得注意的是,全同态加密算法虽然支持在密文上进行任何运算,但由于效率低下的原因无法在现实场景中使用。而现有的很多技术虽然能够利用加法同态构造出密文上的机器学习训练协议,但由于执行算法的过程中用户与云服务器的交互次数太多,增加了方案的通信复杂度,使得整体机器学习的效率降低,还不能完全适用于现实场景,如Nikolaenko等人在2003年提出的基于Paillier和GC(使得开发人员能够使用基本的“异或”门、“或”门和“与”门来定义任意电路的基于Java的开源框架)的岭回归训练方案,由于使用了GC导致计算开销太大。在2005年Gascon等人也提出了一个基于垂直分区数据集的算法,但解决方案仍需要用到GC。参考文献:[1]NikolaenkoV,WeinsbergU,IoannidisS,etal.Privacy-PreservingRidgeRegressiononHundredsofMillionsofRecords[C]//IEEESymposiumonSecurity&Privacy.IEEEComputerSociety,2013.[2]AdriàGascón,SchoppmannP,BalleB,etal.PrivacyPreservingDistributedLinearRegressiononHigh-DimensionalData[J].ProceedingsonPrivacyEnhancingTechnologies,2017,2017(4):345–364.
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种岭回归训练方法,利用密文计算保障个人数据在加密服务提供商训练、流转过程中不泄露个人隐私,保证数据资源在合作过程中的机密性,同时精简计算,提高计算速度的同时降低计算成本。本专利技术的目的通过以下的技术方案实现:一种岭回归训练方法,包括如下步骤:参数初始化,生成系统公共参数,生成DPs(数据提供者)、CSP(加密服务提供商)、ACS(辅助服务器)、DR(数据请求者)的公私钥对,计算ACS与DR的重加密密钥;接收训练请求时,计算CSP与ACS的联合公钥,用联合公钥加密私有数据,生成密文一;通过CSP对密文一进行部分解密,对密文一的每个数据项加噪声以盲化,生成数据包一;通过ACS对数据包一进行解密后再加密,生成数据包二;利用加法同态性质,通过CSP对数据包二进行去盲,加入正则化矩阵,得到中间值,并引入随机值对中间值进行盲化,同时将随机值用重加密密钥加密,生成包括盲化后中间值、加密后随机值的数据包三;通过ACS对加密后随机值进行重加密、对盲化后中间值进行解密操作,生成密文二;通过DR对密文二进行解密,得到模型的最终训练结果。优选的,所述重加密密钥由ACS私钥和DR公钥计算得出。优选的,通过引入常数对密文一每个数据项加噪声。一种计算设备,用于实现上述岭回归训练方法,具体包括:存储设备,用于存储用户数据;存储器,用于存储用于处理的数据以及处理器;所述处理器被配置为:参数初始化,生成系统公共参数,生成DPs(数据提供者)、CSP(加密服务提供商)、ACS(辅助服务器)、DR(数据请求者)的公私钥对,计算ACS与DR的重加密密钥;接收训练请求时,计算CSP与ACS的联合公钥,用联合公钥加密私有数据,生成密文一;通过CSP对密文一进行部分解密,对每个数据项加噪声,生成数据包一;通过ACS对数据包一进行解密后再加密,生成数据包二;利用加法同态性质,通过CSP对数据包二进行去盲,加入正则化矩阵,得到中间值,并引入随机值对中间值进行盲化,同时将随机值用重加密密钥加密,生成包括盲化后中间值、加密后随机值的数据包三;通过ACS对加密后随机值进行重加密、对盲化后中间值进行解密操作,生成密文二;通过DR对密文二进行解密,得到模型的最终训练结果。优选的,所述计算设备还包括用于连接到网络的网络连接。优选的,所述CSP和ACS实现在分离的计算设备上。一种介质,为包含指令的机器可读介质,所述指令在被执行时实现上述岭回归训练方法的步骤。本专利技术与现有技术相比,具有如下优点和有益效果:1、本专利技术用到ElGamal加法变体方案,结合密文重加密技术,保证数据资源在合作过程中的机密性的同时精简计算,提高计算速度的同时降低计算成本。2、利用密文计算保障个人数据在加密服务提供商训练、流转过程中不泄露个人隐私,,使得整个方案在计算和通信上都有明显的提升,而且所有的计算操作都是外包给加密服务提供商的,对用户而言是轻量级的,较适用于当前的云计算场景。附图说明图1是本专利技术实施例一种岭回归训练方法示意图。图2为本专利技术实施例一种保护隐私的医学疾病诊断模型训练示意图。具体实施方式下面结合实施例及附图对本专利技术作进一步详细的描述,但本专利技术的实施方式不限于此。实施例在大数据时代,企业间的数据共享日益频繁,对多源数据进行关联分析和深度挖掘,能够将经过匿名化处理的数据复原,导致现有数据脱敏技术“失灵”,直接威胁用户的个人隐私数据。在大数据平台,一个数据资源池同时服务于多个数据提供者和数据使用者,强化数据隔离和访问控制,实现数据“可用不可见”,是大数据环境下数据安全的新需求。本实施例用到ElGamal加法变体方案,结合密文重加密技术,以实现快速保密训练。1.基于ElGamal的加法同态方案由于原始的ElGamal方案是只具有乘法同态性的,而现有的很多场景都是需要加法同态性的,现有的很多文章都是基于ElGamal方案进行改进,使得其具有加法同态性。下面我们描述一个最直观的改进方法,该密码系统还包含的主要算法:Setup(初始化)、KeyGen(密钥生成)、Enc(加密)和Dec(解密)。Setup:选择一个大素数p,循环群的两个生成元g,α。KeyGen:选择一个随机数计算h=gxmodp本文档来自技高网
...

【技术保护点】
1.一种岭回归训练方法,其特征在于,包括如下步骤:参数初始化,生成系统公共参数,生成DPs、CSP、ACS、DR的公私钥对,计算ACS与DR的重加密密钥;接收训练请求时,计算CSP与ACS的联合公钥,用联合公钥加密私有数据,生成密文一;通过CSP对密文一进行部分解密,对密文一的每个数据项加噪声以盲化,生成数据包一;通过ACS对数据包一进行解密后再加密,生成数据包二;利用加法同态性质,通过CSP对数据包二进行去盲,加入正则化矩阵,得到中间值,并引入随机值对中间值进行盲化,同时将随机值用重加密密钥加密,生成包括盲化后中间值、加密后随机值的数据包三;通过ACS对加密后随机值进行重加密、对盲化后中间值进行解密操作,生成密文二;通过DR对密文二进行解密,得到模型的最终训练结果。

【技术特征摘要】
1.一种岭回归训练方法,其特征在于,包括如下步骤:参数初始化,生成系统公共参数,生成DPs、CSP、ACS、DR的公私钥对,计算ACS与DR的重加密密钥;接收训练请求时,计算CSP与ACS的联合公钥,用联合公钥加密私有数据,生成密文一;通过CSP对密文一进行部分解密,对密文一的每个数据项加噪声以盲化,生成数据包一;通过ACS对数据包一进行解密后再加密,生成数据包二;利用加法同态性质,通过CSP对数据包二进行去盲,加入正则化矩阵,得到中间值,并引入随机值对中间值进行盲化,同时将随机值用重加密密钥加密,生成包括盲化后中间值、加密后随机值的数据包三;通过ACS对加密后随机值进行重加密、对盲化后中间值进行解密操作,生成密文二;通过DR对密文二进行解密,得到模型的最终训练结果。2.根据权利要求1所述的岭回归训练方法,其特征在于,所述重加密密钥由ACS私钥和DR公钥计算得出。3.根据权利要求1所述的岭回归训练方法,其特征在于,通过引入常数对密文一每个数据项加噪声。4.一种计算设备,其特征在于,用于实现权利要求1-3任一项的岭回归训练方法,具体包括:存储设备,用于存储用户...

【专利技术属性】
技术研发人员:周德华王琪杨诗吟杨继勉赖俊祚王传胜
申请(专利权)人:暨南大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1