一种基于布隆过滤器及哈希的高效非平衡PSI制造技术

技术编号：38090346 阅读：12 留言：0更新日期：2023-07-06 09:01

本发明专利技术提供本发明专利技术提供一种基于布隆过滤器及哈希的高效非平衡PSI,在PSI计算过程中，用布隆过滤器先对大数据集进行一轮筛选来降低整体的复杂度；包括大数据集一方将布隆过滤器参数发送给小数据集一方的步骤；小数据集一方根据自身数据集，计算数据集在布隆过滤器中比特位需要置1的索引集，并将所述的索引集发送给大数据集一方的步骤；大数据集一方根据布隆过滤器参数以及小数据集一方的索引集初始化布隆过滤器的步骤；大数据集一方使用布隆过滤器进行筛选，筛选得到自身数据集中有可能在隐私交集的一个元素集合，这个筛选后的集合，作为新的后续求隐私交集的隐私数据集合；非平衡场景下，相比原本基于哈希及半诚实第三方的PSI效率大提高。PSI效率大提高。PSI效率大提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于布隆过滤器及哈希的高效非平衡PSI

[0001]本专利技术涉及一种基于布隆过滤器及哈希的高效非平衡PSI。

技术介绍

[0002]PSI求隐私交集是多方计算中的一种，也是研究得非常深入的一种多方计算场景。最早的基于公钥模幂计算的PSI算法计算消耗大，并不实用。随着目前计算机性能越来越高，相关算法也不断提高发展，性能得到巨大提升。已经在现实生活中有了实际应用。比如微软的Edge浏览器中个人密码泄露的应用，就是使用了基于同态加密的PSI算法。此外，在社交网络中，也可以用来在两个人之间比较共同好友的时候，保护双方完整的好友信息不被泄露。此外PSI还可以用在僵尸网络发现、相似性检测、基因检测等等，实际应用价值潜力巨大。
[0003]近期发展迅速的用来保护用户隐私的联邦机器学习，也使用了PSI算法来做联邦学习参与方之间的训练样本对齐。
[0004]隐私集合求交（PSI）涉及到以下概念：1.哈希算法也称散列函数, 是把任意长度的输入变换成固定长度输出的一种函数，哈希算法一般可以用来提高存储空间的利用率，提高数据的查询效率。密码学中也可以用做数字签名以及数据的唯一摘要，来保障数据传递的安全性。密码学中的哈希函数是不可逆的，即通过输入，可以轻松计算输出，反过来通过输出则不可以计算得到输入。此外，哈希函数还有确定性的性质，即输入确定的时候，输出也是确定的。
[0005]2.PSIPSI是private set intersection（隐私集合求交）的简称，两个或多个实体之间，每个实体都有一个隐私的数据...

【技术保护点】

【技术特征摘要】
1.一种基于布隆过滤器及哈希的高效非平衡PSI，包括数据集大的B方和数据集小的A方；其特征在于：PSI计算方法包括以下步骤：S1、B方将布隆过滤器参数发送给A方；S2、A方根据自身数据集，计算数据集在布隆过滤器中比特位需要置1的索引集，并将所述的索引集发送给B方；S3、B方根据布隆过滤器参数以及A方的索引集初始化布隆过滤器；S4、B方使用布隆过滤器进行筛选，筛选得到自身数据集中有可能在隐私交集的一个元素集合，这个筛选后的集合，作为新的后续求隐私交集的隐私数据集合；S5、A方和B方各自通过哈希算法计算自己隐私数据集中每个数据加入盐值后的哈希值并保存；S6、A方和B方各自将保存的所述哈希值传输给半诚实的第三方；S7、所述半诚实的第三方将双方各自的所述哈希值进行比较，从双方的哈希值集合中，筛选出值相等的哈希值，并将这些筛选出值相等的所述哈希值发送给参与PSI计算的双方；S8、A方和B方接收到第三方发送过来的筛选后的所述值相等的哈希值后，分别与本地保存的哈希值做一个比较，将与第三方转发的哈希值相等的本地哈希值对应的原始数据输出，作为PSI算法的最终输出。2.根据权利要求1所述的基于布隆过滤器及哈希的高效非平衡PSI，其特征在于：在步骤S1之前还包括...

【专利技术属性】
技术研发人员：谈扬，
申请(专利权)人：深圳前海新心数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人