数据处理方法、装置、介质及电子设备制造方法及图纸

技术编号:39253656 阅读:9 留言:0更新日期:2023-10-30 12:05
本申请属于计算机技术领域,具体涉及一种数据处理方法、数据处理装置、计算机可读存储介质、电子设备以及计算机程序产品。该方法包括:对第一主体持有的第一数据序列进行重复元素替换,得到不含重复元素的第二数据序列;将第二数据序列中的元素映射至位置序列,并获取用于将位置序列中的元素映射至第一数据序列的位置映射;将位置序列与第二主体持有的数据进行隐私集合求交得到分别由第一主体和第二主体持有的第一秘密分片;根据位置映射对第一主体持有的第一秘密分片进行映射处理得到第一主体持有的第二秘密分片,第二秘密分片对应的明文用于指示第一数据序列中的各个元素是否为交集数据。本申请可以隐私集合求交的安全计算性能。计算性能。计算性能。

【技术实现步骤摘要】
数据处理方法、装置、介质及电子设备


[0001]本申请属于计算机
,具体涉及一种数据处理方法、数据处理装置、计算机可读存储介质、电子设备以及计算机程序产品。

技术介绍

[0002]隐私集合求交(Private set intersection,PSI)是指参与双方在不泄露任何额外信息(除交集以外的任何信息)的情况下,得到双方持有数据的交集。为了保护参与双方的数据隐私,经过隐私集合求交得到的数据交集可以基于秘密分享的形式进行保存,即参与双方既不会获得数据交集的明文,也无法获知该数据交集与自身持有数据之间的对应关系。而为了将数据交集与自身持有数据进行顺序对齐,还需要花费大量的计算资源和通信资源对数据交集的位置顺序进行秘密分享,这大大增加了数据泄露的风险,也降低了参与双方对于数据安全计算的性能。

技术实现思路

[0003]本申请提供一种数据处理方法、数据处理装置、计算机可读存储介质、电子设备以及计算机程序产品,目的在于提高隐私集合求交的安全计算性能。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面,提供一种数据处理方法,该方法包括:
[0006]对第一主体持有的第一数据序列进行重复元素替换,得到不含所述重复元素的第二数据序列;
[0007]将所述第二数据序列中的元素映射至位置序列,并获取用于将所述位置序列中的元素映射至所述第一数据序列的位置映射;
[0008]将所述位置序列与第二主体持有的数据进行隐私集合求交得到分别由所述第一主体和所述第二主体持有的第一秘密分片,所述第一秘密分片对应的明文用于指示所述位置序列与所述第二主体持有的数据是否存在交集数据;
[0009]根据所述位置映射对所述第一主体持有的第一秘密分片进行映射处理得到所述第一主体持有的第二秘密分片,所述第二秘密分片对应的明文用于指示所述第一数据序列中的各个元素是否为所述交集数据。
[0010]根据本申请实施例的一个方面,提供一种数据处理装置,该装置包括:
[0011]去重模块,被配置为对第一主体持有的第一数据序列进行重复元素替换,得到不含所述重复元素的第二数据序列;
[0012]第一映射模块,被配置为将所述第二数据序列中的元素映射至位置序列,并获取用于将所述位置序列中的元素映射至所述第一数据序列的位置映射;
[0013]求交模块,被配置为将所述第二数据序列与第二主体持有的第三数据序列进行隐私集合求交得到分别由所述第一主体和所述第二主体持有的第一秘密分片,所述第一秘密
分片对应的明文用于指示所述第二数据序列与所述第三数据序列是否存在交集数据;
[0014]第二映射模块,被配置为根据所述位置映射对所述第一主体持有的第一秘密分片进行映射处理得到所述第一主体持有的第二秘密分片,所述第二秘密分片对应的明文用于指示所述第一数据序列中的元素是否为所述交集数据。
[0015]根据本申请实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的数据处理方法。
[0016]根据本申请实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的数据处理方法。
[0017]根据本申请实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行如以上技术方案中的数据处理方法。
[0018]在本申请实施例提供的技术方案中,通过将第一数据序列进行重复元素替换得到第二数据序列,在将第二数据序列映射至位置序列的同时获取用于恢复其位置顺序的位置映射,从而可以在完成隐私集合求交后,使用位置映射对第一秘密分片进行映射处理得到位置顺序恢复的第二秘密分片。由于第二秘密分片与第一数据序列具有相同的位置顺序,由此可以保持解密后的交集数据与第一数据序列具有相同的位置顺序,第一主体无需花费额外的计算资源和通信资源与第二主体做数据位置顺序的秘密分享,因此能够在保证数据安全性的同时提高数据处理效率,减少数据处理的资源消耗。
[0019]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0020]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1示出了应用本申请技术方案的示例性系统架构框图。
[0022]图2示出了本申请相关技术中采用布谷鸟哈希进行隐私集合求交的原理示意图。
[0023]图3示出了本申请一个实施例中基于位置逆映射进行隐私集合求交的数据处理方法。
[0024]图4示出了本申请一个实施例中基于对位置逆映射做映射分解进行隐私集合求交的数据处理方法。
[0025]图5示出了本申请一个实施例中对位置映射进行分解的原理示意图。
[0026]图6示出了本申请一个实施例中基于不经意复制和不经意置换进行数据处理的原理示意图。
[0027]图7示出了本申请一个实施例中基于第一子映射分解实现不经意复制的原理示意图。
[0028]图8示出了本申请一个实施例中不经意置换使用的映射单元示意图。
[0029]图9示出了本申请一个实施例中不经意复制使用的映射单元示意图。
[0030]图10示出了本申请一个实施例中,由映射单元组成串行网络的结构示意图。
[0031]图11示出了本申请一个实施例中由映射单元组成并行网络的结构示意图。
[0032]图12示意性地示出了本申请实施例提供的数据处理装置的结构框图。
[0033]图13示意性示出了适于用来实现本申请实施例的电子设备的计算机系统结构框图。
具体实施方式
[0034]现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
[0035]此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:对第一主体持有的第一数据序列进行重复元素替换,得到不含所述重复元素的第二数据序列;将所述第二数据序列中的元素映射至位置序列,并获取用于将所述位置序列中的元素映射至所述第一数据序列的位置映射;将所述位置序列与第二主体持有的数据进行隐私集合求交得到分别由所述第一主体和所述第二主体持有的第一秘密分片,所述第一秘密分片对应的明文用于指示所述位置序列与所述第二主体持有的数据是否存在交集数据;根据所述位置映射对所述第一主体持有的第一秘密分片进行映射处理得到所述第一主体持有的第二秘密分片,所述第二秘密分片对应的明文用于指示所述第一数据序列中的各个元素是否为所述交集数据。2.根据权利要求1所述的数据处理方法,其特征在于,根据所述位置映射对所述第一主体持有的第一秘密分片进行映射处理得到所述第一主体持有的第二秘密分片,包括:获取与所述位置映射相对应的第一子映射和第二子映射,所述第一子映射用于在数据序列中恢复重复元素,所述第二子映射用于在所述数据序列中恢复位置顺序;根据所述第一子映射在所述第一主体持有的第一秘密分片中恢复重复元素,得到所述第一主体持有的第三秘密分片;根据所述第二子映射将所述第一主体持有的第三秘密分片中各个元素的位置顺序恢复至与所述第一数据序列相同,得到所述第一主体持有的第二秘密分片。3.根据权利要求2所述的数据处理方法,其特征在于,根据所述第二子映射将所述第一主体持有的第三秘密分片中各个元素的位置顺序恢复至与所述第一数据序列相同,得到所述第一主体持有的第二秘密分片,包括:对所述第二子映射和所述第二主体持有的第三秘密分片进行不经意置换,得到所述第一主体持有的第二中间向量和所述第二主体持有的第二秘密分片;所述不经意置换是在不泄露各自持有数据的前提下对数据序列中的元素进行置换映射;根据所述第二子映射对所述第一主体持有的第三秘密分片进行映射处理后,与所述第一主体持有的第二中间向量进行异或运算,得到所述第一主体持有的第二秘密分片。4.根据权利要求2所述的数据处理方法,其特征在于,根据所述第一子映射在所述第一主体持有的第一秘密分片中恢复重复元素,得到所述第一主体持有的第三秘密分片,包括:对所述第一子映射和所述第二主体持有的第一秘密分片进行不经意复制,得到所述第一主体持有的第一中间向量和所述第二主体持有的第三秘密分片;所述不经意复制是在不泄露各自持有数据的前提下对数据序列中的元素进行复制映射;根据所述第一子映射对所述第一主体持有的第一秘密分片进行映射处理后,与所述第一主体持有的第一中间向量进行异或运算,得到所述第一主体持有的第三秘密分片。5.根据权利要求4所述的数据处理方法,其特征在于,对所述第一子映射和所述第二主体持有的第一秘密分片进行不经意复制,得到所述第一主体持有的第一中间向量和所述第二主体持有的第三秘密分片,包括:获取与所述第一子映射相对应的第三子映射和布尔向量,所述第三子映射用于将待恢复的元素放置于相邻位置,所述布尔向量用于确定是否将相邻位置的两个元素复制为重复
元素;对所述第三子映射和所述第二主体持有的第一秘密分片进行不经意置换,得到分别由所述第一主体和所述第二主体持有的第四秘密分片;对所述布尔向量和所述第二主体持有的第四秘密分片进行不经意复制,得到所述第一主体持有的第三中间向量和所述第二主体持有的第五秘密分片;根据所述布尔向量对所述第一主体持有的第四秘密分片进行映射处理后,与所述第三中间向量进行异或运算,得到所述第一主体持有的第五秘密分片;对所述第三子映射的逆映射和所述第二主体持有的第五秘密分片进行不经意置换,得到所述第一主体持有的第四中间向量和所述第二主体持有的第三秘密分片;根据所述第三子映射的逆映射对所述第一主体持有的第五秘密分片进行映射处理后,与所述第一主体持有的第四中间向量进行异或运算,得到所述第一主体持有的第一中间向量。6.根据权利要求5所述的数据处理方法,其特征在于,对所述布尔向量和所述第二主体持有的第四秘密分片进行不经意复制,得到所述第一主体持有的第三中间向量和所述第二主体持有的第五秘密分片,包括:依次从所述第二主体持有的第四秘密分片中选取相邻位置的两个元素,得到N

1个元素对,N为所述第二主体持有的第四秘密分片中的元素数量;根据所述布尔向量选取映射规则,并根据所述映射规则分别对N

1个所述元素对进行映射处理,得到所述第一主体持有的第三中间向量和所述第二主体持有的第五秘密分片。7.根据权利要求6所述的数据处理方法,其特征在于,所述映射规则包括:分别使用第一映射参数和第二映射参数对所述元素对中的第一元素进行映射处理;或者使用所述第一映射参数对所述元素对中的第一元素进行映射处理,并使用所述第二映射参数对所述元素对中的第二元素进行映射处理。8.根据权利要求6所述的数据处理方法,其特征在于,所述映射规则包括如下规则中的任意两种:分别使用第一映射参数和第二映射参数对所述元素对中的第一元素进行映射处理;分别使用所述第一映射参数和所述第二映射参数对所述元素对中的第二元素进行映射处理;使用所述第一映射参数对所述元素对中的第一元素进行映射处理,并使用所述第二映射参数对所述元素对中的第二元素进行映射处理;使用所述第一映射参数对所述元素对中的第二元素进行映射处理,并使用所述第二映射参数对所述元素对中的第一元素进行映射处理。9.根据权利要求6所述的数据处理方法,其特征在于,根据所述布尔向量选取映射规则,并根据所述映射规则分别对N

1个所述元素对进行映射处理,得到所述第一主体持有的第三中间向量和所述第二主体持有的第五秘密分片,包括:获取N

1个映射单元,每个所述映射单元用于对一个所述元素对进行映射处理;将所述布尔向量和N

1个所述元素对分别输入N

1个所述映射单元;根据所述布尔向量中各个元素的取值选取与所述映射单元相对应的映射规则;
按照选取的所述映射规则对输入所述映射单元的所述元素对进行映射处理,得到所述第一主体持有的输出参数和所述第二主体持有的映射参数;汇集所述第一主体持有的输出参数,得到所述第一主体持有的第三中间向量;汇集所述第二主体持有的映射参数,得到所述第二主体持有的第五秘密分片。10.根据权利要求9所述的数据处理方法,其特征在于,根据所述布尔向量中各个元素的取值选取与所述映射单元相对应的映射规则,包括:从所述布尔向量中获取与所述映射单元相对应的目标元素;当所述目标元素取值为第一数值时,选...

【专利技术属性】
技术研发人员:张凡蒋杰刘煜宏陈鹏黄晨宇程勇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1