隐私求交方法、系统、设备及存储介质技术方案

技术编号:36259328 阅读:12 留言:0更新日期:2023-01-07 09:56
本申请公开了一种隐私求交方法、系统、设备及存储介质,属于大数据处理技术领域。该方法包括:对所拥有的第一原文数据执行预处理步骤,得到第一隐私数据并发送至第三方,接收第三方反馈的隐私数据交集,隐私数据交集为第三方对第一隐私数据和至少一组第二隐私数据进行隐私求交得到的数据集,第二隐私数据为第二参与方对其所拥有的第二原文数据执行预处理步骤所得到的,预处理步骤包括:调用预先构建的转换函数对原文数据进行转换处理,得到第一处理数据,对原文数据进行哈希处理,得到第二处理数据,基于预设组合规则,对第一处理数据和第二处理数据进行组合,得到原文数据所对应的隐私数据。本申请旨在提高隐私求交数据集中隐私数据的准确性。隐私数据的准确性。隐私数据的准确性。

【技术实现步骤摘要】
隐私求交方法、系统、设备及存储介质


[0001]本申请涉及大数据处理
,尤其涉及一种隐私求交方法、系统、设备及存储介质。

技术介绍

[0002]在纵向联邦学习中,隐私求交(Private Set Intersection,PSI)是关键的前置步骤。隐私求交是指,参与双方在不泄露任何额外信息的情况下,得到参与双方持有数据的交集,其中,额外信息指的是除了参与双方的数据交集以外的任何信息。
[0003]目前,采用朴素哈希的方法进行隐私求交,即参与双方使用同一哈希函数,计算各自数据的哈希值,再将哈希过的数据互相发送给对方,即可求得交集。但是上述方法在参与双方各自的数据过大时,会出现不同数据的哈希值相同的情况,导致隐私求交得到的数据交集中的数据准确性较低。
[0004]上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0005]本申请的主要目的在于提供一种隐私求交方法、系统、设备及存储介质,旨在解决现有隐私求交方法得到的数据交集中的数据准确性较低的技术问题。
[0006]为实现上述目的,本申请提供一种隐私求交方法,应用于第一参与方,包括以下步骤:
[0007]对所拥有的第一原文数据执行预处理步骤,得到第一隐私数据;
[0008]将所述第一隐私数据发送至第三方;
[0009]接收所述第三方反馈的隐私数据交集,其中,所述隐私数据交集为所述第三方对所述第一隐私数据和至少一组第二隐私数据进行隐私求交得到的数据集,所述第二隐私数据为第二参与方对其所拥有的第二原文数据执行预处理步骤所得到的;
[0010]其中,所述预处理步骤包括:
[0011]调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据;
[0012]对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据;
[0013]基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据。
[0014]可选地,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤,包括:
[0015]调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据,所述转换函数为:
[0016][0017]其中,SA为所述第一处理数据,L为所述原文数据的字符长度,x为转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数。
[0018]可选地,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤之后,还包括:
[0019]在所述第一处理数据的首端或者尾端添加预设安全数据,并更新所述第一处理数据。
[0020]可选地,所述对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据的步骤,包括:
[0021]调用预先构建的预转换函数对所述原文数据进行预转换处理,得到预转换数据,所述预转换函数为:
[0022][0023]其中,SB为所述预转换数据,L为所述原文数据的字符长度,z为预转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数;
[0024]对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符,其中,所述预设映射参数为小于或等于所述预设加密数据的字符长度的正整数;
[0025]对所述预转换数据和所述预设映射参数进行整除运算,得到更新后的预转换数据,返回对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符的步骤,直至所述预转换数据小于或等于所述预设映射参数;
[0026]将获取的第二处理数据中的字符,按照获取时间顺序进行排序,得到第二处理数据。
[0027]可选地,所述基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据的步骤之后,还包括:
[0028]将所述原文数据更新为所述隐私数据,并返回调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤,直至循环次数满足预设条件。
[0029]可选地,所述基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据的步骤,包括:
[0030]对所述第一处理数据和所述第二处理数据进行前后叠加组合,得到所述原文数据所对应的隐私数据;
[0031]或者对所述第一处理数据和所述第二处理按照预设间隔字符数进行间隔组合,得到所述原文数据所对应的隐私数据。
[0032]可选地,所述基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据的步骤之前,还包括:
[0033]对所述第一处理数据和所述第二处理数据分别进行Base64转换处理或者N进制转
换处理;
[0034]则所述基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据的步骤,包括:
[0035]基于预设组合规则,对转换处理后的第一处理数据和第二处理数据进行组合,得到所述原文数据所对应的隐私数据。
[0036]此外,为实现上述目的,本申请还提供一种隐私求交系统,所述隐私求交系统包括:
[0037]第一参与方,所述第一参与方用于对其所拥有的第一原文数据执行预处理步骤,得到第一隐私数据,将所述第一隐私数据发送至第三方,并接收所述第三方反馈的隐私数据交集;
[0038]至少一个第二参与方,所述第二参与方用于对其所拥有的第二原文数据执行预处理步骤,得到第二隐私数据,将所述第二隐私数据发送至所述第三方;
[0039]第三方,所述第三方用于对所述第一隐私数据和至少一组所述第二隐私数据进行隐私求交,得到隐私数据交集,并将所述隐私数据交集反馈至所述第一参与方;
[0040]其中,所述预处理步骤包括:
[0041]调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据;
[0042]对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据;
[0043]基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据;
[0044]其中,所述原文数据为所述第一原文数据,所述隐私数据为第一隐私数据。
[0045]此外,为实现上述目的,本申请还提供一种隐私求交设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的隐私求交程序,所述隐私求交程序配置为实现如上所述的隐私求交方法的步骤。
[0046本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私求交方法,其特征在于,应用于第一参与方,所述隐私求交方法包括以下步骤:对所拥有的第一原文数据执行预处理步骤,得到第一隐私数据;将所述第一隐私数据发送至第三方;接收所述第三方反馈的隐私数据交集,其中,所述隐私数据交集为所述第三方对所述第一隐私数据和至少一组第二隐私数据进行隐私求交得到的数据集,所述第二隐私数据为第二参与方对其所拥有的第二原文数据执行预处理步骤所得到的;其中,所述预处理步骤包括:调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据;对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据;基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据。2.如权利要求1所述的隐私求交方法,其特征在于,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤,包括:调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据,所述转换函数为:其中,SA为所述第一处理数据,L为所述原文数据的字符长度,x为转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数。3.如权利要求1或2所述的隐私求交方法,其特征在于,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤之后,还包括:在所述第一处理数据的首端或者尾端添加预设安全数据,并更新所述第一处理数据。4.如权利要求1所述的隐私求交方法,其特征在于,所述对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据的步骤,包括:调用预先构建的预转换函数对所述原文数据进行预转换处理,得到预转换数据,所述预转换函数为:其中,SB为所述预转换数据,L为所述原文数据的字符长度,z为预转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数;对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符,其中,所述预设映射参数为小于或等于所述预设加密数据的字符长度的正整数;对所述预转换数据和所述预设映射参数进行整除运算,得到更新后的预转换数据,返回对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符的步骤,直至所述预转换数据
小于或等于所述预设映射参数;将获取的第二处理数据中的字符,按照获取时间顺序进行排序,得到第二处理数据。5.如权利要求1所述的隐私求交方法,其特征在于,所述基于预设组合...

【专利技术属性】
技术研发人员:曲立锴李晨龙
申请(专利权)人:北京众尖同屏数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1