This paper proposes a hybrid scheme for privacy preserving ridge regression, which uses both homomorphic encryption and Yao confusion. The user of the system submits its encrypted data under linear homomorphic encryption. The use of linear homomorphisms to perform the algorithm requires only the first phase of the linear operation. The output of this phase generates encrypted data in the form of n. In the second stage, the Yao hybrid circuits are evaluated, Yao confusion circuit first and then realize the homomorphic decryption, the rest of the regression algorithm (as shown in the figure, optimization can avoid confusion in decryption circuit). For this step, the Yao scheme is much faster than the current fully homomorphic encryption scheme. Thus, the advantages of the two schemes can be obtained through the use of linear homomorphism to deal with large data sets and the application of the confusion circuit to the heavy nonlinear computation.
【技术实现步骤摘要】
【国外来华专利技术】相关申请的引用本申请要求于2013年3月4日提交的美国临时申请No.61/772,404的权益,将其以全文引用的方式并入本文中。本申请还涉及同时提交的题为“使用掩码的隐私保护岭回归”和“使用部分同态加密和掩码的隐私保护岭回归”的申请,将其以全文引用的方式并入本文中。
本专利技术一般地涉及数据挖掘,更具体地,涉及使用岭回归(ridgeregression)在数据挖掘期间保护隐私。
技术介绍
推荐系统通过收集很多用户对不同物品的偏好和评价并对数据运行学习算法来工作。学习算法产生可以用于预测新用户将如何评价某些物品的模型。具体地,在给定一用户对某些物品提供的评价的情况下,该模型可以预测该用户对其他物品将如何评价。存在用于产生这种预测模型的海量算法,且很多算法被积极地用在大型网站如亚马逊(Amazon)和网飞(Netflix)上。学习算法还被用在大型医疗数据库、金融数据和很多其他领域中。在当前实现中,为了构建预测模型,学习算法必须以明文(intheclear)看到所有用户数据。在本公开中,确定学习算法是否可以在数据不处于明文状态下工作,由此允许用户保留对其数据的控制。对于医疗数据,这允许在不影响用户隐私的情况下构建模型。对于书籍和电影偏好,让用户保持对其数据的控制降低了将来在服务提供商处发生数据泄漏的情况下意外处于窘境的风险。大致说来,存在对私有用户数据进行数据挖掘的三种现有方案。第 ...
【技术保护点】
一种用于提供隐私保护岭回归的方法,所述方法包括:向加密服务提供商请求混淆电路;从多个用户收集被格式化且使用同态加密来加密的数据;对被格式化且使用同态加密来加密的数据进行求和;以及使用不经意传输,采用求和后的数据对来自所述加密服务提供商的混淆电路进行评估。
【技术特征摘要】
【国外来华专利技术】1.一种用于提供隐私保护岭回归的方法,所述方法包括:
向加密服务提供商请求混淆电路;
从多个用户收集被格式化且使用同态加密来加密的数据;
对被格式化且使用同态加密来加密的数据进行求和;以及
使用不经意传输,采用求和后的数据对来自所述加密服务提供商
的混淆电路进行评估。
2.根据权利要求1所述的方法,其中,向加密服务提供商请求混
淆电路的步骤包括:
提供针对所述混淆电路的输入变量的维度;以及
提供所述输入变量的取值范围。
3.根据权利要求1所述的方法,其中,在计算设备上实现的评估
方执行所述方法。
4.根据权利要求3所述的方法,其中,所述加密服务提供商被实
现在与实现所述评估方的计算设备远离的计算设备上。
5.根据权利要求1所述的方法,还包括以下步骤:提供用于对来
自多个用户的数据进行加密的加密密钥。
6.根据权利要求5所述的方法,其中,还使用由所述加密服务提
供商提供的加密密钥对来自多个用户的数据进一步加密。
7.根据权利要求1所述的方法,其中,评估所述混淆电路的步骤
还包括:
对所述求和后的数据进行解密;以及
对由所述混淆电路体现的岭回归方程进行求解。
8.根据权利要求1所述的方法,其中,从多个用户收集数据的步
骤包括:接收从所述多个用户中每个用户经由计算设备发送的数据。
9.一种用于提供隐私保护岭回归的计算设备,所述计算设备包
括:
存储设备,用于存储用户数据;
存...
【专利技术属性】
技术研发人员:瓦莱里娅·尼古拉延科,尤迪·魏恩斯贝格,斯特拉蒂斯·约安尼季斯,马克·乔伊,尼娜·塔夫脱,
申请(专利权)人:汤姆逊许可公司,
类型:发明
国别省市:法国;FR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。