【技术实现步骤摘要】
交集数据获取方法、设备和系统
[0001]本专利技术涉及数据处理
,尤其涉及一种交集数据获取方法、设备和系统。
技术介绍
[0002]隐私集合求交集(Private Set Intersection,简称PSI)协议,是一种特定的安全多方计算协议,它允许持有数据的两方能够计算得到双方数据集合的交集部分,交集结果可以由一方或者双方获得,但不暴露交集以外的任何数据集合信息,即除交集内的数据外,交集外的集合中任何数据不会泄露给任何数据一方。
[0003]自提出以来,PSI协议引起了学术界和工业界的广泛关注,近年来,已经被应用到了很多实际的计算场景中,例如广告投放、寻找联系人,等等。但在实际部署和应用PSI协议的同时,需要关注的是,PSI协议的输出结果,即交集集合是否包含了一些敏感信息。
[0004]在某些隐私保护的计算场景中,集合交集中可能会包含一些敏感信息,比如用户的身份信息。现有的PSI方案都无法保证交集结果的隐私性。
技术实现思路
[0005]本专利技术实施例提供一种交集数据获取方法、设备和系统,用以实现交集数据获取过程中的隐私数据保护。
[0006]第一方面,本专利技术实施例提供一种获取交集数据的系统,包括:
[0007]执行隐私集合求交集协议的发送方所对应的第一设备以及接收方所对应的第二设备;
[0008]所述第一设备,用于获取所述发送方对应的第一隐私数据集,通过不经意伪随机函数获得密钥,使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集; ...
【技术保护点】
【技术特征摘要】
1.一种获取交集数据的系统,其特征在于,包括:执行隐私集合求交集协议的发送方所对应的第一设备以及接收方所对应的第二设备;所述第一设备,用于获取所述发送方对应的第一隐私数据集,通过不经意伪随机函数获得密钥,使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,将所述第一压缩值集发送至所述第二设备,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;所述第二设备,用于获取所述接收方对应的第二隐私数据集,获取由所述不经意伪随机函数产生的所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集;采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到第二压缩值集,根据所述第一压缩值集与所述第二压缩值集确定所述第二隐私数据集与所述第一隐私数据集的交集。2.根据权利要求1所述的系统,其特征在于,所述压缩函数包括第一哈希函数;所述第一设备,用于采用第一哈希函数对所述第一加密隐私数据集进行哈希计算得到第一哈希值集,将所述第一哈希值集发送至所述第二设备;所述第二设备,用于采用所述第一哈希函数对所述第二加密隐私数据集进行哈希计算得到第二哈希值集,根据所述第一哈希值集与所述第二哈希值集确定所述第二隐私数据集与所述第一隐私数据集的交集。3.根据权利要求2所述的系统,其特征在于,所述第二设备,用于对于所述第二隐私数据集中的任一隐私数据,若所述任一隐私数据在所述第二哈希值集中对应的哈希值包含在所述第一哈希值集中,则确定所述任一隐私数据包含在所述交集内。4.根据权利要求2所述的系统,其特征在于,所述第一设备,用于对所述第一哈希值集中的哈希值进行随机排序后,发送至所述第二设备。5.根据权利要求1所述的系统,其特征在于,所述第一设备,用于以设定概率生成随机字符串,替换所述第一隐私数据集中的隐私数据,所述设定概率根据所述差分隐私预算确定,使用所述密钥对经过所述替换后的第一隐私数据集进行加密得到所述第一加密隐私数据集。6.根据权利要求1至5中任一项所述的系统,其特征在于,所述第一设备,用于对所述第一隐私数据集加密前采用第二哈希函数对所述第一隐私数据集进行哈希计算得到第三哈希值集,所述第一加密隐私数据集是基于所述密钥加密所述第三哈希值集得到的;所述第二设备,用于采用所述第二哈希函数对所述第二隐私数据集进行哈希计算得到第四哈希值集,所述第二加密隐私数据集是基于所述密钥加密所述第四哈希值集得到的。7.一种交集数据获取方法,其特征在于,应用于执行隐私集合求交集协议的发送方所对应的第一设备,所述方法包括:获取所述发送方对应的第一隐私数据集;通过不经意伪随机函数获得密钥;使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;
将所述第一压缩值集发送至执行隐私集合求交集协议的接收方所对应的第二设备,以使所述第二设备根据所述第一压缩值集与第二压缩值集确定所述接收方对应的第二隐私数据集与所述第一隐私数据集的交集,其中,所述第二压缩值集是所述第二设备在获取基于所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集后,采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的。8.根据权利要求7所述的方法,其特征在于,所述压缩函数包括第一哈希函数,所述压缩...
【专利技术属性】
技术研发人员:刘巍然,梁子原,彭力强,张磊,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。