交集数据获取方法、设备和系统技术方案

技术编号:33088737 阅读:10 留言:0更新日期:2022-04-15 10:57
本申请提供一种交集数据获取方法、设备和系统,该系统包括:发送方对应的第一设备和接收方对应的第二设备。第一设备使用通过OPRF获得的密钥对本地第一隐私数据集加密得到第一加密隐私数据集,采用压缩函数对第一加密隐私数据集压缩计算得到第一压缩值集,将第一压缩值发送至第二设备,压缩函数用于将输入数据的长度变为不超过设定长度,设定长度根据差分隐私预算和第一隐私数据集中的数据数量确定。第二设备获取由密钥对第二隐私数据集加密后的第二加密隐私数据集,采用压缩函数对第二加密隐私数据集计算得到第二压缩值集,根据第一压缩值集与第二压缩值集确定第二隐私数据集与第一隐私数据集的交集,得到差分隐私保护的交集。集。集。

【技术实现步骤摘要】
交集数据获取方法、设备和系统


[0001]本专利技术涉及数据处理
,尤其涉及一种交集数据获取方法、设备和系统。

技术介绍

[0002]隐私集合求交集(Private Set Intersection,简称PSI)协议,是一种特定的安全多方计算协议,它允许持有数据的两方能够计算得到双方数据集合的交集部分,交集结果可以由一方或者双方获得,但不暴露交集以外的任何数据集合信息,即除交集内的数据外,交集外的集合中任何数据不会泄露给任何数据一方。
[0003]自提出以来,PSI协议引起了学术界和工业界的广泛关注,近年来,已经被应用到了很多实际的计算场景中,例如广告投放、寻找联系人,等等。但在实际部署和应用PSI协议的同时,需要关注的是,PSI协议的输出结果,即交集集合是否包含了一些敏感信息。
[0004]在某些隐私保护的计算场景中,集合交集中可能会包含一些敏感信息,比如用户的身份信息。现有的PSI方案都无法保证交集结果的隐私性。

技术实现思路

[0005]本专利技术实施例提供一种交集数据获取方法、设备和系统,用以实现交集数据获取过程中的隐私数据保护。
[0006]第一方面,本专利技术实施例提供一种获取交集数据的系统,包括:
[0007]执行隐私集合求交集协议的发送方所对应的第一设备以及接收方所对应的第二设备;
[0008]所述第一设备,用于获取所述发送方对应的第一隐私数据集,通过不经意伪随机函数获得密钥,使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,将所述第一压缩值集发送至所述第二设备,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;
[0009]所述第二设备,用于获取所述接收方对应的第二隐私数据集,获取由所述不经意伪随机函数产生的所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集;采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到第二压缩值集,根据所述第一压缩值集与所述第二压缩值集确定所述第二隐私数据集与所述第一隐私数据集的交集。
[0010]第二方面,本专利技术实施例提供一种交集数据获取方法,应用于执行隐私集合求交集协议的发送方所对应的第一设备,所述方法包括:
[0011]获取所述发送方对应的第一隐私数据集;
[0012]通过不经意伪随机函数获得密钥;
[0013]使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;
[0014]采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐
私预算和所述第一隐私数据集中包含的数据数量确定;
[0015]将所述第一压缩值集发送至执行隐私集合求交集协议的接收方所对应的第二设备,以使所述第二设备根据所述第一压缩值集与第二压缩值集确定所述接收方对应的第二隐私数据集与所述第一隐私数据集的交集,其中,所述第二压缩值集是所述第二设备在获取基于所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集后,采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的。
[0016]第三方面,本专利技术实施例提供一种交集数据获取装置,应用于执行隐私集合求交集协议的发送方所对应的第一设备,所述装置包括:
[0017]获取模块,用于获取所述发送方对应的第一隐私数据集;
[0018]处理模块,用于通过不经意伪随机函数获得密钥,使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集,采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;
[0019]发送模块,用于将所述第一压缩值集发送至执行隐私集合求交集协议的接收方所对应的第二设备,以使所述第二设备根据所述第一压缩值集与第二压缩值集确定所述接收方对应的第二隐私数据集与所述第一隐私数据集的交集,其中,所述第二压缩值集是所述第二设备在获取基于所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集后,采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的。
[0020]第四方面,本专利技术实施例提供一种电子设备,包括:存储器、处理器、通信接口;其中,所述存储器上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器至少可以实现如第二方面所述的交集数据获取方法。
[0021]第五方面,本专利技术实施例提供一种交集数据获取方法,应用于执行隐私集合求交集协议的接收方所对应的第一设备,所述方法包括:
[0022]获取所述接收方对应的第一隐私数据集;
[0023]获取由不经意伪随机函数产生的密钥对所述第一隐私数据集加密后的第一加密隐私数据集;
[0024]采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和第二隐私数据集中包含的数据数量确定,所述第二隐私数据集对应于执行隐私集合求交集协议的发送方;
[0025]接收所述发送方对应的第二设备发送的第二压缩值集,其中,所述第二压缩值是所述第二设备通过不经意伪随机函数获得密钥,使用所述密钥对所述第二隐私数据集进行加密得到第二加密隐私数据集,以及采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的;
[0026]根据所述第一压缩值集与所述第二压缩值集确定所述第一隐私数据集与所述第二隐私数据集的交集。
[0027]第六方面,本专利技术实施例提供一种交集数据获取装置,应用于执行隐私集合求交集协议的接收方所对应的第一设备,所述装置包括:
[0028]获取模块,用于获取所述接收方对应的第一隐私数据集,以及,获取由不经意伪随
机函数产生的密钥对所述第一隐私数据集加密后的第一加密隐私数据集;
[0029]处理模块,采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和第二隐私数据集中包含的数据数量确定,所述第二隐私数据集对应于执行隐私集合求交集协议的发送方;
[0030]接收模块,用于接收所述发送方对应的第二设备发送的第二压缩值集,其中,所述第二压缩值是所述第二设备通过不经意伪随机函数获得密钥,使用所述密钥对所述第二隐私数据集进行加密得到第二加密隐私数据集,以及采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的;
[0031]所述处理模块,还用于根据所述第一压缩值集与所述第二压缩值集确定所述第一隐私数据集与所述第二隐私数据集的交集。
[0032]第七方面,本专利技术实施例提供一种电子设备,包括:存储器、处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取交集数据的系统,其特征在于,包括:执行隐私集合求交集协议的发送方所对应的第一设备以及接收方所对应的第二设备;所述第一设备,用于获取所述发送方对应的第一隐私数据集,通过不经意伪随机函数获得密钥,使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,将所述第一压缩值集发送至所述第二设备,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;所述第二设备,用于获取所述接收方对应的第二隐私数据集,获取由所述不经意伪随机函数产生的所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集;采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到第二压缩值集,根据所述第一压缩值集与所述第二压缩值集确定所述第二隐私数据集与所述第一隐私数据集的交集。2.根据权利要求1所述的系统,其特征在于,所述压缩函数包括第一哈希函数;所述第一设备,用于采用第一哈希函数对所述第一加密隐私数据集进行哈希计算得到第一哈希值集,将所述第一哈希值集发送至所述第二设备;所述第二设备,用于采用所述第一哈希函数对所述第二加密隐私数据集进行哈希计算得到第二哈希值集,根据所述第一哈希值集与所述第二哈希值集确定所述第二隐私数据集与所述第一隐私数据集的交集。3.根据权利要求2所述的系统,其特征在于,所述第二设备,用于对于所述第二隐私数据集中的任一隐私数据,若所述任一隐私数据在所述第二哈希值集中对应的哈希值包含在所述第一哈希值集中,则确定所述任一隐私数据包含在所述交集内。4.根据权利要求2所述的系统,其特征在于,所述第一设备,用于对所述第一哈希值集中的哈希值进行随机排序后,发送至所述第二设备。5.根据权利要求1所述的系统,其特征在于,所述第一设备,用于以设定概率生成随机字符串,替换所述第一隐私数据集中的隐私数据,所述设定概率根据所述差分隐私预算确定,使用所述密钥对经过所述替换后的第一隐私数据集进行加密得到所述第一加密隐私数据集。6.根据权利要求1至5中任一项所述的系统,其特征在于,所述第一设备,用于对所述第一隐私数据集加密前采用第二哈希函数对所述第一隐私数据集进行哈希计算得到第三哈希值集,所述第一加密隐私数据集是基于所述密钥加密所述第三哈希值集得到的;所述第二设备,用于采用所述第二哈希函数对所述第二隐私数据集进行哈希计算得到第四哈希值集,所述第二加密隐私数据集是基于所述密钥加密所述第四哈希值集得到的。7.一种交集数据获取方法,其特征在于,应用于执行隐私集合求交集协议的发送方所对应的第一设备,所述方法包括:获取所述发送方对应的第一隐私数据集;通过不经意伪随机函数获得密钥;使用所述密钥对所述第一隐私数据集进行加密得到第一加密隐私数据集;采用设定的压缩函数对所述第一加密隐私数据集进行压缩计算得到第一压缩值集,所述压缩函数用于将输入数据的长度变为不超过设定长度,所述设定长度根据差分隐私预算和所述第一隐私数据集中包含的数据数量确定;
将所述第一压缩值集发送至执行隐私集合求交集协议的接收方所对应的第二设备,以使所述第二设备根据所述第一压缩值集与第二压缩值集确定所述接收方对应的第二隐私数据集与所述第一隐私数据集的交集,其中,所述第二压缩值集是所述第二设备在获取基于所述密钥对所述第二隐私数据集加密后的第二加密隐私数据集后,采用所述压缩函数对所述第二加密隐私数据集进行压缩计算得到的。8.根据权利要求7所述的方法,其特征在于,所述压缩函数包括第一哈希函数,所述压缩...

【专利技术属性】
技术研发人员:刘巍然梁子原彭力强张磊
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1