隐私保护集合求交方法和装置制造方法及图纸

技术编号:38623470 阅读:8 留言:0更新日期:2023-08-31 18:26
本申请公开了隐私保护集合求交方法和装置。所述方法包括:第一计算中心根据第一数据,对第一数据集合进行数据分桶,并将桶划分为多个数据子片;第二计算中心根据第二数据,对第二数据集合进行数据分桶;第一计算中心向第二计算中心提供与多个数据子片对应的多个第一数据密文文件;第二计算中心对第二数据集合的多个桶内的数据集与第一数据集合的对应桶内的第一数据密文文件的数据集进行求交计算,得到第一数据的求交结果密文;第一计算中心解密获得求交结果明文。采用这种处理方式,使得将一次大数据量的集中求交计算转化为分布式并行执行多个桶的小数据量的求交计算,并减少求交数据量,因此,可以有效提升大数据量场景的非平衡PSI性能。非平衡PSI性能。非平衡PSI性能。

【技术实现步骤摘要】
隐私保护集合求交方法和装置


[0001]本申请涉及隐私计算
,具体涉及隐私保护集合求交方法和装置,以及电子设备,信息推送系统,隐私保护联系人发现系统,恶意软件检测系统。

技术介绍

[0002]随着多行业数字化转型加速,数据的价值正在被越来越多的企业广泛认知,加强数据资源整合可实现产业间高效协同,帮助行业、机构实现数据价值的共享与协作。
[0003]数据在共享计算时,会产生隐私信息、商业数据价值泄漏风险,需要隐私计算(Privacy

Enhancing Computation)实现数据安全的流通。一种常用的隐私计算是隐私保护集合求交(Private Set Intersection,PSI),PSI包括平衡PSI和非平衡PSI(Unbalance Privacy

Enhancing Computation,UPSI),其中非平衡PSI用于两方数据量悬殊的场景。
[0004]然而,在实现本专利技术过程中,专利技术人发现上述技术方案至少存在如下问题:非平衡PSI只支持百万数据量的计算,不支持十亿甚至更大的数据量计算,无法面向诸如百万对十亿数据量的非平衡PSI真实使用场景。

技术实现思路

[0005]本申请提供隐私保护集合求交方法,以解决现有技术存在的无法支持接收方在十万甚至百万级数据量、发送方在十亿甚至更大的数据量的隐私保护集合求交的问题。本申请另外提供隐私保护集合求交装置,以及电子设备,信息推送系统,隐私保护联系人发现系统,恶意软件检测系统。<br/>[0006]本申请提供一种隐私保护集合求交方法,包括:
[0007]第一计算中心获取第一数据集合;
[0008]根据第一数据,将所述第一数据集合划分为多个桶;
[0009]将所述桶划分为多个数据子片;
[0010]向第二计算中心提供与所述多个数据子片对应的多个第一数据密文文件;
[0011]接收所述第二计算中心提供的所述第一数据的求交结果密文;所述求交结果密文是对所述文件内的第一数据密文子集和所述第二计算中心的对应桶内的第二数据子集进行求交计算获得的,所述第二计算中心是对第二数据集合划分的多个桶与对应的所述文件求交;
[0012]对所述第一数据的求交结果密文进行解密,以获得所述第一数据的求交结果明文。
[0013]可选的,所述第二计算中心是对第二数据集合划分的多个桶并行与对应的所述文件求交。
[0014]可选的,所述获取第一数据集合,包括:从数据源并行获取所述第一数据集合的多个数据切片。
[0015]可选的,所述根据第一数据,将所述第一数据集合划分为多个桶,包括:根据第一
数据,并行将所述数据切片内的第一数据分配到对应桶。
[0016]可选的,还包括:对所述多个桶的第一数据进行并行加密。
[0017]可选的,所述将所述桶划分为多个数据子片,包括:将所述多个桶并行划分为多个数据子片。
[0018]可选的,还包括:确定桶和进程之间的对应关系。
[0019]可选的,还包括:在进程内开启多个线程;确定所述进程内的桶和线程之间的对应关系;根据所述桶和线程之间的对应关系,通过多个线程对所述进程内的多个桶的第一数据进行并行加密。
[0020]可选的,所述向第二计算中心提供与所述多个数据子片对应的多个第一数据密文文件,包括:向第二计算中心并行传输所述多个第一数据密文文件。
[0021]可选的,还包括以下至少一个步骤:根据所述第一数据集合的数据量和所述第一计算中心的可用资源量,确定进程数;根据非平衡PSI算法,确定桶数据阈值;根据所述第一数据集合的数据量和桶数据阈值,确定桶数量;根据所述第一数据集合的数据量和进程数,确定数据切片的数据量阈值;根据非平衡PSI算法,确定数据子片的数据量阈值。
[0022]本申请还提供一种隐私保护集合求交方法,包括:
[0023]第二计算中心获取第二数据集合;
[0024]根据第二数据,将所述第二数据集合划分为多个桶;
[0025]接收第一计算中心提供的多个第一数据密文文件,所述第一数据密文文件包括多个第一数据密文,所述多个第一数据密文文件与多个数据子片对应,所述多个数据子片是对第一数据集合的多个桶进行划分得到的,所述第一数据集合的多个桶是根据所述第一数据对所述第一数据集合划分得到的;
[0026]对所述第二数据集合的多个桶内的第二数据子集与所述第一数据集合的对应桶内的所述文件的第一数据密文子集进行求交计算;
[0027]向所述第一计算中心提供所述第一数据的求交结果密文。
[0028]可选的,并行对所述第二数据集合的多个桶内的第二数据子集与所述第一数据集合的对应桶内的所述文件的第一数据密文子集进行求交计算。
[0029]本申请还提供一种电子设备,包括:
[0030]处理器;以及
[0031]存储器,用于存储实现根据上述方法的程序,该设备通电并通过所述处理器运行所述方法的程序。
[0032]本申请还提供一种信息推送系统,包括:
[0033]客户端,用于获取购车用户标识集合;根据所述购车用户标识,将所述购车用户标识集合划分为多个桶;将所述桶划分为多个购车用户标识子片;向服务端提供与所述多个购车用户标识子片对应的多个购车用户标识密文文件;接收所述服务端回送的所述购车用户标识的求交结果密文;对所述求交结果密文进行解密,以获得同为服务端用户的目标购车用户;以及,向服务端提供目标购车用户标识;
[0034]服务端,用于获取服务端用户标识集合;根据所述服务端用户标识,将所述服务端用户标识集合划分为多个桶;接收所述多个购车用户标识密文文件;对所述服务端用户标识集合的多个桶内的服务端用户标识子集与所述购车用户标识集合的对应桶内的所述文
件的购车用户标识子集进行求交计算;向所述客户端提供所述求交结果密文;以及,接收所述目标购车用户标识;根据所述目标购车用户标识,获取与目标购车用户的购车行为相关的营销信息;向目标用户提供所述营销信息。
[0035]本申请还提供一种信息推送方法,包括:
[0036]获取购车用户标识集合;
[0037]根据所述购车用户标识,将所述购车用户标识集合划分为多个桶;
[0038]将所述桶划分为多个购车用户标识子片;
[0039]向服务端提供与所述多个购车用户标识子片对应的多个购车用户标识密文文件;
[0040]接收所述服务端回送的所述购车用户标识的求交结果密文;所述求交结果密文是对所述文件内的购车用户标识密文子集和所述服务端的对应桶内的服务端用户标识子集进行求交计算获得的,所述服务端是对服务端用户标识集合划分的多个桶与对应的所述文件求交;
[0041]对所述求交结果密文进行解密,以获得同为服务端用户的目标购车用户;
[0042]向服务端提供目标购车用户标识。
[0043]本申请还提供一种信息推送方法,包括:
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私保护集合求交方法,其特征在于,包括:第一计算中心获取第一数据集合;根据第一数据,将所述第一数据集合划分为多个桶;将所述桶划分为多个数据子片;向第二计算中心提供与所述多个数据子片对应的多个第一数据密文文件;接收所述第二计算中心提供的所述第一数据的求交结果密文;所述求交结果密文是对所述文件内的第一数据密文子集和所述第二计算中心的对应桶内的第二数据子集进行求交计算获得的,所述第二计算中心是对第二数据集合划分的多个桶与对应的所述文件求交;对所述第一数据的求交结果密文进行解密,以获得所述第一数据的求交结果明文。2.根据权利要求1所述的方法,其特征在于,还包括以下至少一个步骤:根据所述第一数据集合的数据量和所述第一计算中心的可用资源量,确定进程数;根据非平衡PSI算法,确定桶数据阈值;根据所述第一数据集合的数据量和桶数据阈值,确定桶数量;根据所述第一数据集合的数据量和进程数,确定数据切片的数据量阈值;根据非平衡PSI算法,确定数据子片的数据量阈值。3.一种隐私保护集合求交方法,其特征在于,包括:第二计算中心获取第二数据集合;根据第二数据,将所述第二数据集合划分为多个桶;接收第一计算中心提供的多个第一数据密文文件,所述第一数据密文文件包括多个第一数据密文,所述多个第一数据密文文件与多个数据子片对应,所述多个数据子片是对第一数据集合的多个桶进行划分得到的,所述第一数据集合的多个桶是根据所述第一数据对所述第一数据集合划分得到的;对所述第二数据集合的多个桶内的第二数据子集与所述第一数据集合的对应桶内的所述文件的第一数据密文子集进行求交计算;向所述第一计算中心提供所述第一数据的求交结果密文。4.一种信息推送方法,其特征在于,包括:获取购车用户标识集合;根据所述购车用户标识,将所述购车用户标识集合划分为多个桶;将所述桶划分为多个购车用户标识子片;向服务端提供与所述多个购车用户标识子片对应的多个购车用户标识密文文件;接收所述服务端回送的所述购车用户标识的求交结果密文;所述求交结果密文是对所述文件内的购车用户标识密文子集和所述服务端的对应桶内的服务端用户标识子集进行求交计算获得的,所述服务端是对服务端用户标识集合划分的多个桶与对应的所述文件求交;对所述求交结果密文进行解密,以获得同为服务端用户的目标购车用户;向服务端提供目标购车用户标识。5.一种信息推送方法,其特征在于,包括:获取服务端用户标识集合;
根据所述服务端用户标识,将所述服务端用户标识集合划分为多个桶;接收客户端提供的多个购车用户标识密文文件,所述购车用户标识密文文件包括多个购车用户标识密文,所述多个购车用户标识密文文件与多个购车用户标识子片对应,所述多个购车用户标识子片是对购车用户标识集合的多个桶进行划分得到的,所述购车用户标识集合的多个桶是根据所述购车用户标识对所述购车用户标识集合划分得到的;对所述服务端用户标识集合的多个桶内的服务端用户标识子集与所述购车用户标识集合的对应桶内的所述文件的购车用户标识子集进行求交计算;向所述客户端提供所述求交结果密文;接收客户端提供的目标购车用户标识;根据所述目标购车用户标识,获取与目标购车用户的购车行为相关的营销信息;向目标用户提供所述营销信息。6.一种信息推送方法,其特征在于,包括:获取银行卡睡眠用户标识集合;根据所述睡眠用户标识,将所述睡眠用户标识集合划分为多个桶;将所述桶划分为多个睡眠用户标识子片;向服务端提供与所述多个睡眠用户标识子片对应的多个睡眠用户标识密文文件;接收所述服务端回送的所述睡眠用户标识的求交结果密文;所述求交结果密文是对所述文件内的睡眠用户标识密文子集和所述服务端的对应桶内的服务端用户标识子集进行求交计算获得的,所述服务端是对服务端用户标识集合划分的多个桶与对应的所述文件求交;对所述求交结果密文进行解密,以获得同为服务端用户的目标睡眠用户;向服务端提供目标睡眠用户标识。7.一种信息推送方法,其特征在于,包括:获取服务端用户标识集合;根据所述服务端用户标识,将所述服务端用户标识集合划分为多个桶;接收客户端提供的多个睡眠用户标识密文文件,所述睡眠用户标识密文文件包括多个睡眠用户标识密文,所述多个睡眠用户标识密文文件与多个数据子片对应,所述多个数据子片是对银行卡睡眠用户标识集合的多个桶进行划分得到的,所述银行卡睡眠用户标识集合的多个桶是根据所述银行卡睡眠用户标识对所述银行卡睡眠用户标识集合划分得到的;对所述服务端用户标识集合的多个桶内的服务端用户标识子集与所述睡眠用户标识集合的对应桶内的所述文件的睡眠用户标识子集进行求交计算;向所述客户端提供所述求交结果密文;接收客户端提供的目标睡眠用户标识;根据所述目标睡眠用户标识,向目标...

【专利技术属性】
技术研发人员:祺远
申请(专利权)人:瓴羊智能科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1