基于隐私保护的数据处理方法及装置制造方法及图纸

技术编号：41256365 阅读：26 留言：0更新日期：2024-05-11 09:16

本说明书实施例提供了基于隐私保护的数据处理方法及装置。该方法涉及持有第一数据集合的第一参与方，以及持有第二数据集合的第二参与方。该方法可由第一参与方的第一设备执行，包括：利用预设的数据分区规则将第一数据集合划分成m个第一分区；其中，m为第一参与方和第二参与方协商的最大分区数，第二数据集合基于该数据分区规则被划分成m个第二分区；通过与第二参与方的第二设备、及包括向量不经意线性评估VOLE生成器的第三设备的交互，并行确定m个第一分区各自和与其分区号相同的第二分区之间的第一交集；将各个第一交集的并集，确定为第一数据集合和第二数据集合之间的第二交集。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书实施例属于计算机，尤其涉及基于隐私保护的数据处理方法及装置。

技术介绍

1、在隐私计算场景下，经常面临多方合作。其中，在海量数据规模下，有些算法变得不可实现，尤其是一些非单纯的map计算的算法，如：需要对全量数据进行二选哈希法(2-choice hashing)等特性的。在海量数据规模下，内存和计算性能都成为了瓶颈。

技术实现思路

1、本专利技术的目的在于提供一种基于隐私保护的数据处理方案，在海量数据规模下，能有效降低隐私计算的内存需求，提升计算性能。

2、本说明书第一方面提供一种基于隐私保护的数据处理方法，涉及持有第一数据集合的第一参与方，以及持有第二数据集合的第二参与方，所述方法由所述第一参与方的第一设备执行，包括：利用预设的数据分区规则将所述第一数据集合划分成m个第一分区；其中，m为所述第一参与方和所述第二参与方协商的最大分区数，所述第二数据集合基于所述数据分区规则被划分成m个第二分区；通过与所述第二参与方的第二设备、及包括向量不经意线性评估vole生成器的第三设...

【技术保护点】

1.一种基于隐私保护的数据处理方法，涉及持有第一数据集合的第一参与方，以及持有第二数据集合的第二参与方，所述方法由所述第一参与方的第一设备执行，包括：

2.根据权利要求1所述的方法，其中，所述数据分区规则中包括第一哈希函数；

3.根据权利要求2所述的方法，其中，所述第一数据集合和所述第二数据集合的数据量均为n，所述数据分区规则中还包括哈希桶分配子规则；

4.根据权利要求1所述的方法，其中，所述通过与所述第二参与方的第二设备、及包括向量不经意线性评估VOLE生成器的第三设备的交互，并行确定所述m个第一分区各自和与其分区号相同的第二分区之间的第一交集，包括...

【技术特征摘要】

2.根据权利要求1所述的方法，其中，所述数据分区规则中包括第一哈希函数；

3.根据权利要求2所述的方法，其中，所述第一数据集合和所述第二数据集合的数据量均为n，所述数据分区规则中还包括哈希桶分配子规则；

4.根据权利要求1所述的方法，其中，所述通过与所述第二参与方的第二设备、及包括向量不经意线性评估vole生成器的第三设备的交互，并行确定所述m个第一分区各自和与其分区号相同的第二分区之间的第一交集，包括：

5.根据权利要求4所述的方法，其中，单个第二哈希桶和单个第三哈希桶对应相同的期望数据量；

6.根据权利要求4或5所述的方法，其中，所述通过与所述第二设备和所述第三设备的交互，确定所述n个第二哈希桶各自包括的各个第一数据和与其桶号相同的第三哈希桶包括的各个第二数据之间的第三交集，包括：

7.一种基于隐私保护的数据处理方法，涉及持有第一数据集合的第一参与方，以及持有第二数据集合的第二参与方，所述方法由所述第二参与方的第二设备执行，包括：

8.根据权利要求7所述的方法，其中，所述数据分区规则中包括第一哈希函数；

9.根据权利要求8所述的方法，其中，所述第一数据集合和所述第二数据集合的数据量均为n...

【专利技术属性】
技术研发人员：董佳佳，张启超，殷山，
申请(专利权)人：蚂蚁区块链科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人