【技术实现步骤摘要】
隐私求交方法、系统、设备及存储介质
[0001]本申请涉及大数据处理
,尤其涉及一种隐私求交方法、系统、设备及存储介质。
技术介绍
[0002]在纵向联邦学习中,隐私求交(Private Set Intersection,PSI)是关键的前置步骤。隐私求交是指,参与双方在不泄露任何额外信息的情况下,得到参与双方持有数据的交集,其中,额外信息指的是除了参与双方的数据交集以外的任何信息。
[0003]目前,采用朴素哈希的方法进行隐私求交,即参与双方使用同一哈希函数,计算各自数据的哈希值,再将哈希过的数据互相发送给对方,即可求得交集。但是上述方法在参与双方各自的数据过大时,会出现不同数据的哈希值相同的情况,导致隐私求交得到的数据交集中的数据准确性较低。
[0004]上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0005]本申请的主要目的在于提供一种隐私求交方法、系统、设备及存储介质,旨在解决现有隐私求交方法得到的数据交集中的数据准确性较低的技术问题。 ...
【技术保护点】
【技术特征摘要】
1.一种隐私求交方法,其特征在于,应用于第一参与方,所述隐私求交方法包括以下步骤:对所拥有的第一原文数据执行预处理步骤,得到第一隐私数据;将所述第一隐私数据发送至第三方;接收所述第三方反馈的隐私数据交集,其中,所述隐私数据交集为所述第三方对所述第一隐私数据和至少一组第二隐私数据进行隐私求交得到的数据集,所述第二隐私数据为第二参与方对其所拥有的第二原文数据执行预处理步骤所得到的;其中,所述预处理步骤包括:调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据;对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据;基于预设组合规则,对所述第一处理数据和所述第二处理数据进行组合,得到所述原文数据所对应的隐私数据。2.如权利要求1所述的隐私求交方法,其特征在于,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤,包括:调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据,所述转换函数为:其中,SA为所述第一处理数据,L为所述原文数据的字符长度,x为转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数。3.如权利要求1或2所述的隐私求交方法,其特征在于,所述调用预先构建的转换函数对原文数据进行转换处理,得到与所述原文数据对应的第一处理数据的步骤之后,还包括:在所述第一处理数据的首端或者尾端添加预设安全数据,并更新所述第一处理数据。4.如权利要求1所述的隐私求交方法,其特征在于,所述对所述原文数据进行哈希处理,得到与所述原文数据对应的第二处理数据的步骤,包括:调用预先构建的预转换函数对所述原文数据进行预转换处理,得到预转换数据,所述预转换函数为:其中,SB为所述预转换数据,L为所述原文数据的字符长度,z为预转换基数,SI[i]为所述原文数据的第i个字符所对应的标记码,i为所述原文数据中字符的位置序数;对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符,其中,所述预设映射参数为小于或等于所述预设加密数据的字符长度的正整数;对所述预转换数据和所述预设映射参数进行整除运算,得到更新后的预转换数据,返回对所述预转换数据和预设映射参数进行求余运算,得到映射位置,并从预设加密数据中选取与所述映射位置对应的字符作为第二处理数据中的字符的步骤,直至所述预转换数据
小于或等于所述预设映射参数;将获取的第二处理数据中的字符,按照获取时间顺序进行排序,得到第二处理数据。5.如权利要求1所述的隐私求交方法,其特征在于,所述基于预设组合...
【专利技术属性】
技术研发人员:曲立锴,李晨龙,
申请(专利权)人:北京众尖同屏数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。