隐私数据求交集的方法、装置、设备及存储介质制造方法及图纸

技术编号:37853852 阅读:23 留言:0更新日期:2023-06-14 22:46
本申请提供一种隐私数据求交集的方法、装置、设备及存储介质。涉及数据隐私保护处理技术领域。该方法包括:对第一方的第一原始数据集合进行转换,得到第一数据集合,第一数据集合包括多个第一业务数据;获取第二方发送的对第二方的第二原始数据集合进行转换得到的第二数据集合,第二数据集合包括多个第二业务数据;根据预设阈值,确定约等集合;对第二数据集合中的每个第二业务数据计算特征值,根据特征值对第二数据集合中的第二业务数据进行特征分类,得到多个类别集合;确定每个第一业务数据的特征值;根据第一业务数据的特征值、多个类别集合和约等集合,确定第一原始数据集合和第二原始数据集合的交集。本申请可以提高了求交集的效率。交集的效率。交集的效率。

【技术实现步骤摘要】
隐私数据求交集的方法、装置、设备及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种隐私数据求交集的方法、装置、设备及存储介质。

技术介绍

[0002]近年来,隐私保护集合交集(Private Set Intersection,PSI)允许持有数据集合的两方共同确定两个数据集合的交集。一方或是两方获取两个数据集合的交集的过程中,不会得到交集以外的任何数据,因此提高了持有数据集合的各方的数据安全。其中,隐私保护集合交集可以应用在多个场景中,例如,应用在确定广告转换率的场景中,一方的数据集合包括已浏览某一物品广告的多个用户信息,另一方的数据集合包括已购买该物品的多个用户信息。通过确定两方数据集合的交集,可以确定广告的转换率。
[0003]在现有技术中,一般是通过计算机设备分别提取两方数据集合内的数据,然后两两对比,确定两方数据集合的交集。专利技术人发现现有技术至少存在如下技术问题:当数据集合内的数据量较大时,通过两两对比的次数较多,导致计算机设备处理两方数据集合的交集时存在效率低的问题。

技术实现思路

[0004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私数据求交集的方法,其特征在于,包括:对第一方的第一原始数据集合进行转换,得到第一数据集合,所述第一数据集合包括多个第一业务数据;获取第二方发送的对第二方的第二原始数据集合进行转换得到的第二数据集合,所述第二数据集合包括多个第二业务数据;根据预设阈值,确定约等集合;对所述第二数据集合中的每个第二业务数据计算特征值,根据所述特征值对所述第二数据集合中的第二业务数据进行特征分类,得到多个类别集合;确定每个所述第一业务数据的特征值;根据所述第一业务数据的特征值、所述多个类别集合和所述约等集合,确定所述第一原始数据集合和所述第二原始数据集合的交集。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一业务数据的特征值、所述多个类别集合和所述约等集合,确定所述第一原始数据集合和所述第二原始数据集合的交集,包括:对于每个第一业务数据,根据所述第一业务数据的特征值和所述约等集合,从所述多个类别集合中确定待对比的第一目标集合;将所述待对比的第一目标集合中的每个第二业务数据与所述第一业务数据进行比对,得到所述第一原始数据集合和所述第二原始数据集合的交集。3.根据权利要求2所述的方法,其特征在于,所述将所述待对比的第一目标集合中的每个第二业务数据与所述第一业务数据进行比对,得到所述第一原始数据集合和所述第二原始数据集合的交集,包括:将所述待对比的第一目标集合中的每个第二业务数据与所述第一业务数据进行比对;若存在所述第一业务数据和所述第二业务数据之间的误差值不大于误差阈值,则确定所述第一业务数据对应的第一原始数据属于第一原始数据集合和第二原始数据集合的交集。4.根据权利要求1所述的方法,其特征在于,所述根据所述第一业务数据的特征值、所述多个类别集合和所述约等集合,确定所述第一原始数据集合和所述第二原始数据集合的交集,包括:对于每个类别集合,根据所述类别集合中每个第二业务数据的特征值和所述约等集合,确定多个第二目标集合;根据所述每个第一业务数据的特征值,从所述多个第二目标集合中选取与所述第一业务数据对应的第二目标集合;将所述第一业务数据对应的第二目标集合中的每个第二业务数据与所述第一业务数据进行比对,得到所述第一原始数据集合和所述第二原始数据集合的交集。5.根据权利要求1所述的方法,其特征在于,所述确定每个所述第一业务数据的特征值,包括:对于每个所述第一业务数据,确定所述第一业务数...

【专利技术属性】
技术研发人员:何笑鸥金易潘源盛巩博儒吴磊
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1