隐私保护岭回归制造技术

技术编号:13431162 阅读:72 留言:0更新日期:2016-07-30 03:21
提出了用于隐私保护岭回归的混合方案,其既使用同态加密也使用Yao混淆电路。系统中的用户提交其在线性同态加密下加密的数据。使用线性同态来执行算法的仅要求线性运算的第一阶段。该阶段的输出以独立于用户数目n的形式生成加密数据。在第二阶段中,对Yao混淆电路进行评估,Yao混淆电路首先实现同态解密,然后进行回归算法的其余部分(如图所示,优化实现可以避免混淆电路中的解密)。对于该步骤,Yao混淆电路方案远快于当前的全同态加密方案。从而,通过使用线性同态来处理大数据集并且将混淆电路用于繁重的非线性计算部分,可以同时获得两种方案的优点。

Privacy ridge regression

This paper proposes a hybrid scheme for privacy preserving ridge regression, which uses both homomorphic encryption and Yao confusion. The user of the system submits its encrypted data under linear homomorphic encryption. The use of linear homomorphisms to perform the algorithm requires only the first phase of the linear operation. The output of this phase generates encrypted data in the form of n. In the second stage, the Yao hybrid circuits are evaluated, Yao confusion circuit first and then realize the homomorphic decryption, the rest of the regression algorithm (as shown in the figure, optimization can avoid confusion in decryption circuit). For this step, the Yao scheme is much faster than the current fully homomorphic encryption scheme. Thus, the advantages of the two schemes can be obtained through the use of linear homomorphism to deal with large data sets and the application of the confusion circuit to the heavy nonlinear computation.

【技术实现步骤摘要】
【国外来华专利技术】相关申请的引用本申请要求于2013年3月4日提交的美国临时申请No.61/772,404的权益,将其以全文引用的方式并入本文中。本申请还涉及同时提交的题为“使用掩码的隐私保护岭回归”和“使用部分同态加密和掩码的隐私保护岭回归”的申请,将其以全文引用的方式并入本文中。
本专利技术一般地涉及数据挖掘,更具体地,涉及使用岭回归(ridgeregression)在数据挖掘期间保护隐私。
技术介绍
推荐系统通过收集很多用户对不同物品的偏好和评价并对数据运行学习算法来工作。学习算法产生可以用于预测新用户将如何评价某些物品的模型。具体地,在给定一用户对某些物品提供的评价的情况下,该模型可以预测该用户对其他物品将如何评价。存在用于产生这种预测模型的海量算法,且很多算法被积极地用在大型网站如亚马逊(Amazon)和网飞(Netflix)上。学习算法还被用在大型医疗数据库、金融数据和很多其他领域中。在当前实现中,为了构建预测模型,学习算法必须以明文(intheclear)看到所有用户数据。在本公开中,确定学习算法是否可以在数据不处于明文状态下工作,由此允许用户保留对其数据的控制。对于医疗数据,这允许在不影响用户隐私的情况下构建模型。对于书籍和电影偏好,让用户保持对其数据的控制降低了将来在服务提供商处发生数据泄漏的情况下意外处于窘境的风险。大致说来,存在对私有用户数据进行数据挖掘的三种现有方案。第一种方案让用户使用秘密共享将其数据分割在多个服务器上。然后,这些服务器使用分布式协议来运行学习算法,且只要大多数服务器不进行串通,就确保了隐私。第二种方案基于全同态加密(fullyhomomorphicencryption),在全同态加密中,针对加密数据执行学习算法,且仅受信第三方被托付来对最终加密模型进行解密。在第三种方案中,Yao氏混淆(garbled)电路构造可以用于针对加密数据进行计算,并获得最终模型,而不了解与用户数据有关的任何其它信息。然而,基于Yao的方案之前从未被应用到回归(regression)类算法中。
技术实现思路
提出了用于隐私保护岭回归的混合方案,其既使用同态加密也使用Yao混淆电路。系统中的用户提交其在线性同态加密系统(例如,Paillier或Regev)下加密的数据。评估方使用线性同态来执行算法的仅要求线性运算的第一阶段。该阶段产生加密数据。在该第一阶段中,系统需要处理大量记录(正比于系统中的用户数目n)。在该第一阶段中的处理对数据进行准备,使得算法的第二阶段独立于n。在第二阶段中,评估方对Yao混淆电路进行评估,Yao混淆电路首先实现同态解密,然后进行回归算法的其余部分(如图所示,优化实现可以避免混淆电路中的解密)。回归算法的该步骤要求快速的线性系统求解器,并且是高度非线性的。对于该步骤,Yao混淆电路方案远快于当前的全同态加密方案。因此,通过使用线性同态来处理大数据集并且将混淆电路用于繁重的非线性计算部分,可以同时获得两种方案的优点。由于将计算分为两个阶段,第二阶段还独立于n。在一个实施例中,提供了用于隐私保护岭回归的方法。该方法包括以下步骤:向加密服务提供商请求混淆电路(garbledcircuit);从多个用户收集被格式化且使用同态加密(homomophicencryption)来加密的数据;对被格式化且使用同态加密来加密的数据进行求和;以及使用不经意传输(oblivioustransfer),采用求和后的数据对来自加密服务提供商的混淆电路进行评估。在另一实施例中,提供了用于隐私保护岭回归的计算设备。该计算设备包括:存储设备、存储器和处理器。该存储设备用于存储用户数据。该存储器用于存储用于处理的数据。该处理器被配置为:向加密服务提供商请求混淆电路;从多个用户收集被格式化且使用同态加密来加密的数据;对被格式化且使用同态加密来加密的数据进行求和;以及使用不经意传输,采用求和后的数据对来自加密服务提供商的混淆电路进行评估。目标和优点将借助权利要求中具体指出的要素和结合来实现和达成。重要的是注意到:所公开的实施例仅是本文中创新教导的许多有利用途的示例。应当理解,前面的总体描述和以下具体实施方式均是示例性和解释性的,而非对所要求保护的专利技术的限制。此外,一些声明可以适用于某些创造性特征,而不适用于其他创造性特征。总体上,除非另行指示,否则在不失一般性的情况下,单数要素可以是复数个。在附图中,相同标号在若干副图中始终表示相同部分。附图说明图1示出了根据实施例的隐私保护岭回归系统的示意框图。图2示出了根据实施例的计算设备的示意框图。图3示出了根据实施例的示例混淆电路。图4示出了根据实施例的用于提供隐私保护岭回归的方法的高级流程图。图5示出了根据实施例的用于提供隐私保护岭回归的第一协议的操作。图6示出了根据实施例的用于提供隐私保护岭回归的第一协议的操作。图7示出了根据实施例的Cholesky分解算法的示例实施例。具体实施方式本公开关注于在很多学习算法中使用的基础机制,即岭回归。在给定高维中的大量点的情况下,回归算法产生穿过这些点的最佳拟合曲线。目标是在不暴露用户数据或关于用户数据的任何其他信息的情况下执行计算。这通过使用图1所示的系统来实现。在图1中,提供了用于实现隐私保护岭回归的系统100的实施例的框图。该系统包括彼此通信的评估方110、一个或多个用户120和加密服务提供商(CSP)130。评估方110实现在计算设备如服务器或个人计算机(PC)上。CSP130类似地实现在计算设备如服务器或个人计算机上,并通过网络(例如,以太网或Wi-Fi网络)与评估方110通信。一个或多个用户120经由计算设备(例如,个人计算机、平板电脑、智能电话等)与评估方110和CSP130通信。用户120(从例如PC)向(在例如服务器上)运行学习算法的评估方110发送加密数据。在某些方面,评估方可以与被相信不会与评估方110串通的(另一服务器上的)加密服务提供商130交互。最终结果是明文预测模型β140。图2示出了示例计算设备200,例如服务器、PC、平板电脑或智能电话,其可用于实现用于隐私保护岭回归的各种方法和系统元件。计算设备200包括一个或多个处理器210、存储器(内存)220、存储设备230和网络接口240。这些元件中的每一个将在下面详细讨论本文档来自技高网
...

【技术保护点】
一种用于提供隐私保护岭回归的方法,所述方法包括:向加密服务提供商请求混淆电路;从多个用户收集被格式化且使用同态加密来加密的数据;对被格式化且使用同态加密来加密的数据进行求和;以及使用不经意传输,采用求和后的数据对来自所述加密服务提供商的混淆电路进行评估。

【技术特征摘要】
【国外来华专利技术】1.一种用于提供隐私保护岭回归的方法,所述方法包括:
向加密服务提供商请求混淆电路;
从多个用户收集被格式化且使用同态加密来加密的数据;
对被格式化且使用同态加密来加密的数据进行求和;以及
使用不经意传输,采用求和后的数据对来自所述加密服务提供商
的混淆电路进行评估。
2.根据权利要求1所述的方法,其中,向加密服务提供商请求混
淆电路的步骤包括:
提供针对所述混淆电路的输入变量的维度;以及
提供所述输入变量的取值范围。
3.根据权利要求1所述的方法,其中,在计算设备上实现的评估
方执行所述方法。
4.根据权利要求3所述的方法,其中,所述加密服务提供商被实
现在与实现所述评估方的计算设备远离的计算设备上。
5.根据权利要求1所述的方法,还包括以下步骤:提供用于对来
自多个用户的数据进行加密的加密密钥。
6.根据权利要求5所述的方法,其中,还使用由所述加密服务提
供商提供的加密密钥对来自多个用户的数据进一步加密。
7.根据权利要求1所述的方法,其中,评估所述混淆电路的步骤
还包括:
对所述求和后的数据进行解密;以及
对由所述混淆电路体现的岭回归方程进行求解。
8.根据权利要求1所述的方法,其中,从多个用户收集数据的步
骤包括:接收从所述多个用户中每个用户经由计算设备发送的数据。
9.一种用于提供隐私保护岭回归的计算设备,所述计算设备包
括:
存储设备,用于存储用户数据;
存...

【专利技术属性】
技术研发人员:瓦莱里娅·尼古拉延科尤迪·魏恩斯贝格斯特拉蒂斯·约安尼季斯马克·乔伊尼娜·塔夫脱
申请(专利权)人:汤姆逊许可公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1