一种用于大数据的隐私集合求交方法及系统技术方案

技术编号:41740077 阅读:28 留言:0更新日期:2024-06-19 12:59
本发明专利技术公开了一种用于大数据的隐私集合求交方法及系统。该方法包括预处理阶段和在线处理阶段;预处理阶段:发起方、参与方各自构建分片池,所述分片池具有N个分片,每个分片具有唯一的分片号;发起方、参与方分别对自身持有的待求交数据集中的每个数据进行处理,得到每个数据对应的校验码,并计算出每个校验码对应的分片号,将校验码存储到具有对应分片号的分片内;在线处理阶段:发起方、参与方对具有同样分片号的分片内的校验码进行隐私集合求交运算,发起方获得求交结果;发起方根据求交结果从自身持有的待求交数据集中查找出交集数据。本发明专利技术能够在有限的计算资源内保证隐私集合求交运行的效率和准确性,提升资源的利用率。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,尤其涉及一种用于大数据的隐私集合求交方法及系统


技术介绍

1、隐私集合求交(private set intersection,psi)作为解决数据隐私保护的方案之一,受到广泛关注和研究。隐私集合交集是指持有数据的两方能够计算得到双方数据集合的交集部分,而不暴露交集以外的任何数据集合信息,其作为安全多方计算中的一个重要分支,其不仅具有重要的理论意义,也具有广泛的应用场景。

2、目前,在金融风控、营销等领域的安全多方计算中经常会用到隐私集合求交,这些领域的待求交数据集往往数据量很庞大,而隐私集合求交需要对待求交数据进行加密,需要的计算资源较多,计算时间较长,从而使得发起方、参与方需要消耗较多的计算资源、计算时间用于隐私集合求交计算,甚至可能出现某一方只有较少的计算资源,无法承担庞大数据的隐私集合求交需要的计算资源。


技术实现思路

1、本专利技术为了解决上述技术问题,提供了一种用于大数据的隐私集合求交方法及系统,其能够将求交任务分解成多个可以独立执行的子任务,从而可以在有限本文档来自技高网...

【技术保护点】

1.一种用于大数据的隐私集合求交方法,其特征在于,包括预处理阶段和在线处理阶段;

2.根据权利要求1所述的一种用于大数据的隐私集合求交方法,其特征在于,所述分片池具有的N个分片的分片号分别为1、2、3……N。

3.根据权利要求1所述的一种用于大数据的隐私集合求交方法,其特征在于,所述预处理阶段中对数据进行处理,得到该数据对应的校验码的方法包括以下步骤:

4.根据权利要求3所述的一种用于大数据的隐私集合求交方法,其特征在于,所述预处理阶段中计算出校验码对应的分片号的方法包括以下步骤:将校验码对N取模,得到该校验码对应的分片号,计算公式为:G=S mod ...

【技术特征摘要】

1.一种用于大数据的隐私集合求交方法,其特征在于,包括预处理阶段和在线处理阶段;

2.根据权利要求1所述的一种用于大数据的隐私集合求交方法,其特征在于,所述分片池具有的n个分片的分片号分别为1、2、3……n。

3.根据权利要求1所述的一种用于大数据的隐私集合求交方法,其特征在于,所述预处理阶段中对数据进行处理,得到该数据对应的校验码的方法包括以下步骤:

4.根据权利要求3所述的一种用于大数据的隐私集合求交方法,其特征在于,所述预处理阶段中计算出校验码对应的分片号的方法包括以下步骤:将校验码对n取模,得到该校验码对应的分片号,计算公式为:g=s mod n,其中,g为分片号,s为校验码。

5.根据权利要求3所述的一种用于大数据的隐私集合求交方法,其特征在于,所述校验码生成算法为crc32算法、sm3算法、md5算法或sha算法。

6.根据权利要求1所述的一种用于大数据的隐私集合求交方法,其特征在...

【专利技术属性】
技术研发人员:周洋肖任江哲王良萸程洋
申请(专利权)人:蓝象智联杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1