一种隐私求交方法、系统和可读存储介质技术方案

技术编号:37279043 阅读:11 留言:0更新日期:2023-04-20 23:45
本发明专利技术实施例提供了一种隐私求交方法、系统和可读存储介质。所述方法包括:第一方对第一数据集执行第一哈希操作得到第一哈希表;第二方对第二数据集执行第二哈希操作得到第二哈希表;第一方与第二方执行乱序秘密分享协议;第二方利用第一乱序序列对第二哈希表进行乱序操作,并将乱序后的第二哈希表中的各数据分别减去第一分享序列中对应位置的数据,得到更新后的第二哈希表;第一方与第二方执行OPRF协议;第一方对第一OPRF结果与第二OPRF结果进行比对,获取第一目标集;第一方基于第一目标集与第二方基于第一分享序列,获取第一数据集和第二数据集的交集数据的秘密分享结果。本发明专利技术实施例可以保护隐私求交的数据隐私安全。明实施例可以保护隐私求交的数据隐私安全。明实施例可以保护隐私求交的数据隐私安全。

【技术实现步骤摘要】
一种隐私求交方法、系统和可读存储介质


[0001]本专利技术涉及多方安全计算领域,尤其涉及一种隐私求交方法、系统和可读存储介质。

技术介绍

[0002]两方场景的PSI(Private Set Intersection,隐私求交)是指基于隐私保护对两个参与方的数据集合求交集。PSI是密码学中多方安全计算领域近年来兴起的一个重要场景,在金融、政务、工业等领域的敏感隐私数据流通中发挥了重要作用,执行隐私计算的参与方可以通过PSI来预处理自己拥有的隐私数据,使得双方能筛选出有价值的共有数据进行后续的计算。
[0003]例如,银行和医院想要筛选出共同拥有的某些用户的金融和医疗数据进行后续的机器学习模型训练,那么双方利用各自拥有的用户身份标识数据来进行PSI运算,能够在不泄露各自拥有的其他用户隐私数据的前提下,筛选出共同拥有的用户身份标识数据,从而可以利用共同拥有的用户身份标识数据对应的金融和医疗数据进行后续的隐私计算。
[0004]然而,目前的PSI方法,参与方可以获得明文的交集数据,从而暴露参与方的隐私数据。

技术实现思路

[0005]本专利技术实施例提供一种隐私求交方法、系统和可读存储介质,参与隐私求交的双方获得的是交集数据的秘密分享结果,可以保护参与方的数据隐私安全。
[0006]为了解决上述问题,本专利技术实施例公开了一种隐私求交方法,用于对第一方的第一数据集和第二方的第二数据集进行隐私求交,所述方法包括:所述第一方对所述第一数据集执行第一哈希操作,得到第一哈希表;所述第二方对所述第二数据集执行第二哈希操作,得到第二哈希表;所述第一方基于所述第一哈希表与所述第二方执行乱序秘密分享协议,使得所述第一方得到更新后的第一哈希表,所述第二方得到第一分享序列;所述更新后的第一哈希表与所述第一分享序列构成所述第一哈希表经第一乱序序列打乱后的乱序秘密分享结果,所述第一乱序序列为所述第二方拥有;所述第二方利用所述第一乱序序列对所述第二哈希表进行乱序操作,并将乱序后的第二哈希表中的各数据分别减去所述第一分享序列中对应位置的数据,得到更新后的第二哈希表;所述第一方与所述第二方通过执行不经意伪随机函数OPRF协议,使得所述第一方获得所述更新后的第一哈希表中的各数据对应的第一OPRF结果,所述第二方获得所述更新后的第二哈希表中的各数据对应的第二OPRF结果;所述第二方将所述第二OPRF结果发送至所述第一方,所述第一方对所述第一OPRF结果与所述第二OPRF结果进行比对,并根据比对结果获取第一目标集,所述第一目标集中
包括与第二OPRF结果相等的第一OPRF结果在所述更新后的第一哈希表中对应位置的数据;所述第一方基于所述第一目标集与所述第二方基于所述第一分享序列,获取所述第一数据集和所述第二数据集的交集数据的秘密分享结果。
[0007]另一方面,本专利技术实施例公开了一种隐私求交系统,用于对第一方的第一数据集和第二方的第二数据集进行隐私求交,所述系统包括第一方和第二方,其中:所述第一方,用于对所述第一数据集执行第一哈希操作,得到第一哈希表,并基于所述第一哈希表与所述第二方执行乱序秘密分享协议,使得所述第一方得到更新后的第一哈希表,所述第二方得到第一分享序列;所述更新后的第一哈希表与所述第一分享序列构成所述第一哈希表经第一乱序序列打乱后的乱序秘密分享结果,所述第一乱序序列为所述第二方拥有;所述第二方,用于对所述第二数据集执行第二哈希操作,得到第二哈希表,利用所述第一乱序序列对所述第二哈希表进行乱序操作,并将乱序后的第二哈希表中的各数据分别减去所述第一分享序列中对应位置的数据,得到更新后的第二哈希表;所述第一方,还用于与所述第二方通过执行不经意伪随机函数OPRF协议,使得所述第一方获得所述更新后的第一哈希表中的各数据对应的第一OPRF结果,所述第二方获得所述更新后的第二哈希表中的各数据对应的第二OPRF结果;所述第二方,还用于将所述第二OPRF结果发送至所述第一方;所述第一方,还用于对所述第一OPRF结果与所述第二OPRF结果进行比对,并根据比对结果获取第一目标集,所述第一目标集中包括与第二OPRF结果相等的第一OPRF结果在所述更新后的第一哈希表中对应位置的数据;所述第一方,还用于基于所述第一目标集与所述第二方基于所述第一分享序列,获取所述第一数据集和所述第二数据集的交集数据的秘密分享结果。
[0008]可选地,所述第一哈希操作包括布谷鸟哈希操作,所述第二哈希操作包括简单哈希操作,所述第一哈希操作和所述第二哈希操作使用相同的哈希函数,所述第一哈希表和所述第二哈希表的长度相等。
[0009]再一方面,本专利技术实施例公开了一种用于隐私求交的装置,包括有存储器,以及一个以上程序,其中一个以上程序存储于存储器中,且经配置以由一个以上处理器执行所述一个以上程序,所述一个以上程序包含用于进行如前述一个或多个所述的隐私求交方法的指令。
[0010]又一方面,本专利技术实施例公开了一种机器可读存储介质,其上存储有指令,当所述指令由装置的一个或多个处理器执行时,使得装置执行如前述一个或多个所述的隐私求交方法。
[0011]本专利技术实施例包括以下优点:本专利技术实施例利用哈希技术、Shuffle

SS(乱序秘密分享协议)和OPRF(Oblivious Pseudorandom Function,不经意伪随机函数)等技术,实现了一种输出交集结果是秘密分享形式的隐私求交方法,使得参与隐私求交的两个参与方(如第一方和第二方)获得双方数据集的交集数据的秘密分享结果。第一方和第二方分别得到一半的秘密分享结果,两个参与方均无法获得交集数据的具体信息,仅能够得知交集数据的数目,可以保护交集数据的隐私安全。进一步地,由于第一方和第二方获得的是交集数据的秘密分享结果,因此,第一
方和第二方可以利用各自持有的交集数据的秘密分享结果,基于秘密分享协议直接进行以交集数据为输入的任意多方安全计算,例如利用交集数据的秘密分享结果进行机器学习训练等,可以提高后续多方安全计算的效率,并且不会暴露每个交集数据的明文信息。
附图说明
[0012]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0013]图1是本专利技术的一种隐私求交方法实施例的步骤流程图;图2是本专利技术一个示例中第一方与第二方第一次执行乱序秘密分享协议得到的结果示意图;图3是本专利技术一个示例中第一OPRF结果和第二OPRF结果的示意图;图4是本专利技术一个示例中第一方与第二方第二次执行乱序秘密分享协议得到的结果示意图;图5是本专利技术的一种隐私求交系统实施例的结构框图;图6是本专利技术的一种用于隐私求交的装置800的框图;图7是本专利技术的一些实施例中服务器的结构示意图。
具体实施方式
[0014]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私求交方法,其特征在于,用于对第一方的第一数据集和第二方的第二数据集进行隐私求交,所述方法包括:所述第一方对所述第一数据集执行第一哈希操作,得到第一哈希表;所述第二方对所述第二数据集执行第二哈希操作,得到第二哈希表;所述第一方基于所述第一哈希表与所述第二方执行乱序秘密分享协议,使得所述第一方得到更新后的第一哈希表,所述第二方得到第一分享序列;所述更新后的第一哈希表与所述第一分享序列构成所述第一哈希表经第一乱序序列打乱后的乱序秘密分享结果,所述第一乱序序列为所述第二方拥有;所述第二方利用所述第一乱序序列对所述第二哈希表进行乱序操作,并将乱序后的第二哈希表中的各数据分别减去所述第一分享序列中对应位置的数据,得到更新后的第二哈希表;所述第一方与所述第二方通过执行不经意伪随机函数OPRF协议,使得所述第一方获得所述更新后的第一哈希表中的各数据对应的第一OPRF结果,所述第二方获得所述更新后的第二哈希表中的各数据对应的第二OPRF结果;所述第二方将所述第二OPRF结果发送至所述第一方,所述第一方对所述第一OPRF结果与所述第二OPRF结果进行比对,并根据比对结果获取第一目标集,所述第一目标集中包括与第二OPRF结果相等的第一OPRF结果在所述更新后的第一哈希表中对应位置的数据;所述第一方基于所述第一目标集与所述第二方基于所述第一分享序列,获取所述第一数据集和所述第二数据集的交集数据的秘密分享结果。2.根据权利要求1所述的方法,其特征在于,所述第一哈希操作包括布谷鸟哈希操作,所述第二哈希操作包括简单哈希操作,所述第一哈希操作和所述第二哈希操作使用相同的哈希函数,所述第一哈希表和所述第二哈希表的长度相等。3.根据权利要求1所述的方法,其特征在于,所述将乱序后的第二哈希表中的各数据分别减去所述第一分享序列中对应位置的数据,包括:在所述乱序后的第二哈希表中的某个位置存在两条以上数据时,将所述两条以上数据分别减去所述第一分享序列中对应位置的数据。4.根据权利要求1所述的方法,其特征在于,所述第一方与所述第二方通过执行不经意伪随机函数OPRF协议,使得所述第一方获得所述更新后的第一哈希表中的各数据对应的第一OPRF结果,所述第二方获得所述更新后的第二哈希表中的各数据对应的第二OPRF结果,包括:所述第一方作为接收方,将所述更新后的第一哈希表中的各数据及其位置信息作为OPRF协议的输入数据,所述第二方作为发送方,双方执行批量的OPRF协议,使得所述第一方获得所述更新后的第一哈希表中的各数据在其位置信息下对应的第一OPRF结果,所述第二方得到每个位置信息对应的OPRF密钥;所述第二方利用所述每个位置信息对应的OPRF密钥以及所述更新后的第二哈希表中的各数据及其位置信息,计算得到所述更新后的第二哈希表中的各数据在其位置信息下对应的第二OPRF结果。5.根据权利要求1所述的方法,其特征在于,所述第一目标集与所述第一哈希表以及所述第二哈希表的长度相等,所述第一方基于所述第一目标集与所述第二方基于所述第一分
享序列,获取所述第一数据集和所述第二数据集的交集数据的秘密分享结果,包括:所述第二方基于所述第一分享序列与所述第一方执行乱序秘密分享协议,使得所述第二方得到更新后的第一分享序列,所述第一方得到第二分享序列;所述更新后的第一分享序列与所述第二分享序列构成所述第一分享序列经第二乱序序列打乱后的乱序秘密分享结果,所述第二乱序序列为所述第一方拥有;所述第一方利用所述第二乱序序列对所述第一目标集进行乱序操作,并将乱序后的第一目标集中的各数据分别加上所述第二分享序列中对应位置的数据,得到更新后的第一目标集;所述第一方将所述更新后的第一目标集中各交集相关数据的位置信息发送至所述第二方,所述第二方从所述更新后的第一分享序列中提取所述位置信息对应的数据,得到第二目标集;所述更新后的第一目标集和所...

【专利技术属性】
技术研发人员:黄熹之李艺
申请(专利权)人:华控清交信息科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1