当前位置: 首页 > 专利查询>浙江大学专利>正文

一种信息保护增强的带标签隐私集合求交方法技术

技术编号:37981864 阅读:7 留言:0更新日期:2023-06-30 09:56
本发明专利技术公开了一种信息保护增强的带标签隐私集合求交方法,涉及隐私计算技术领域,该方法由数据需求方发起,并与一个数据及其标签的持有方共同执行,所述方法包括:参与双方采用椭圆曲线上的求逆迪菲赫尔曼密钥协商协议变种,加入数据乱序操作,获得匿踪后的匹配数据下标;数据需求方采用乱序操作的逆过程,还原出交集原始数据下标;双方执行不经意传输协议,数据需求方获取交集数据对应的标签。该方法能够筛选出符合某些特性的数据标签信息,而不对参与方泄露参与求交的任何数据,能够保持标签以外数据的私密性。标签以外数据的私密性。标签以外数据的私密性。

【技术实现步骤摘要】
一种信息保护增强的带标签隐私集合求交方法


[0001]本专利技术涉及隐私计算领域,尤其涉及一种信息保护增强的带标签隐私集合求交方法。

技术介绍

[0002]数据爆发式增长为互联网行业带来了便利性的同时,也带来了数据隐私泄露的风险。隐私集合求交(Private Set Intersection,PSI)技术旨在解决两个数据持有者寻找共同数据过程中的隐私问题,其功能是让协议的参与方计算出各自数据集合之间的交集,同时保证交集以外数据的隐私性。隐私集合求交技术在私有联系人发现、联邦学习数据对齐、广告转化率分析等场景中均应用广泛。
[0003]传统的隐私集合求交技术只能做到对同维度数据交集的求取,而未考虑交集数据对应的其他可用特征问题。带标签的隐私集合求交(Labeled PSI,LPSI)提供了一种全新的功能:标签数据持有方拥有数据与标签组成的二元组,数据需求方仅拥有未带标签的数据,协议让数据需求方获得交集中的数据标签二元组,其中交集由不带标签的数据确定。
[0004]LPSI由Chen等人在2018年提出,目前已在生物信息识别、恶意内容检测等领域得到应用。然而,在上述应用中,数据需求方只需要获得标签即可,获得的交集数据(即不带标签的数据)均是不必要的。交集数据属于额外的信息泄露,在一些情况下会引发隐私风险(例如苹果公司的图片检测系统可以通过该交集数据创造后门来获取用户的任意图片,这也成为了一些LPSI系统难以实际部署的主要原因。

技术实现思路

[0005]本专利技术的目的在于针对现有LPSI技术的不足,提供一种信息保护增强的带标签隐私集合求交方法。
[0006]本专利技术的目的是通过以下技术方案来实现的:
[0007]本专利技术实施例的第一方面提供了一种信息保护增强的带标签隐私集合求交方法,包括如下步骤:
[0008](1)根据迪菲赫尔曼密钥协商的隐私集合求交协议变种,数据需求方在本地生成随机全排列π,并对标签数据持有方的中间数据进行乱序操作后发回至标签数据持有方;
[0009](2)数据需求方利用全排列信息π,对标签数据持有方处理后的下标信息执行乱序的逆过程,得到交集元素对应的原始下标;
[0010](3)利用不经意传输协议,数据需求方根据步骤(2)得到的下标获取交集数据对应的标签。
[0011]进一步地,所述步骤(1)包括如下子步骤:
[0012](1.1)数据需求方和标签数据持有方分别对各自的原始数据集合X和Y进行预处理,其中标签持有方仅处理求交数据x
i
∈X得到H(x
i
),所得结果H(x
i
)数乘本地私钥α得到αH(x
i
),将αH(x
i
)发送给数据需求方;数据需求方处理y
j
∈Y并数乘本地私钥k得到kH(y
j
),将
kH(y
j
)放入布隆过滤器BF中;
[0013](1.2)数据需求方根据步骤(1.2)收到的数据量大小生成全排列π,对步骤(1.2)中收到的αH(x
i
)乱序得到αH(x
π(i)
),数乘自己的私钥后得到kαH(x
π(i)
),将kαH(x
π(i)
)与步骤(1.2)中生成的布隆过滤器BF一并发给标签持有方;
[0014](1.3)标签持有方根据步骤(1.2)中收到的kαH(x
π(i)
)横坐标,还原出纵坐标后计算kH(x
π(i)
)=α
‑1kαH(x
π(i)
),即为乱序后的密钥协商结果。
[0015]进一步地,所述步骤(1.1)中数据需求方和标签数据持有方分别对各自的原始数据集合X和Y进行预处理包括:
[0016]将原始输入映射至椭圆曲线群E(F
p
):对于一个数据集合S中的每一个元素s
i
,采用安全哈希函数SHA

256将其打散,并通过模p操作映射到域F
p
中,结果记为x
i
;使用欧拉准则判断x
i
能否成为椭圆曲线的横坐标,若能,则表明存在对应的纵坐标y
i
使得(x
i
,y
i
)满足椭圆曲线方程,输出椭圆曲线点H(s
i
)=(x
i
,y
i
);若否,对x
i
加1再次使用欧拉准则直到能够返回曲线上的点,或是达到预设的尝试上限并哈希到曲线失败的信息。
[0017]进一步地,所述步骤(2)包括如下子步骤:
[0018](2.1)对步骤(1.2)收到的乱序后数据kαH(x
π(i)
),标签数据持有方乘上私钥逆元α
‑1,得到kH(x
π(i)
),并基于步骤(1.2)的布隆过滤器BF,找出所有满足kH(x
π(i)
)∈BF的下标π(i)发送给数据需求方;
[0019](2.2)基于步骤(2.1)得到的乱序下标π(i),数据需求方根据生成的全排列π,还原出非乱序的原始下标i=π
‑1°
π(i)。
[0020]进一步地,所述步骤(3)包括:
[0021]基于步骤(2.2)得到的原始下标i,数据需求方与标签数据持有方共同执行不经意传输协议,数据需求方得到相应的标签l
i

[0022]本专利技术实施例的第二方面提供了一种信息保护增强的带标签隐私集合求交装置,包括一个或多个处理器,用于实现上述的信息保护增强的带标签隐私集合求交方法。
[0023]本专利技术实施例的第三方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,用于实现上述的信息保护增强的带标签隐私集合求交方法。
[0024]与现有技术相比,本专利技术使数据需求方无法获得交集数据而仅能获得标签数据,限制了其信息获取的范围和权限。而标签数据持有方获得交集大小这一非隐私信息,该松弛操作有助于协议运行效率的提升。
[0025]本专利技术的有益效果是:让数据需求方获取其需要的数据的前提下,实现信息泄露最小化。
[0026]本专利技术针对带标签隐私集合求交在现实场景中可能发生的隐私泄露问题,提出了信息保护增强的带标签隐私集合求交方法,该方法能够保证标签持有方仅获得交集集合的大小、数据需求方仅获得交集数据对应的标签。该方法引入的全排列计算计算开销极小,整体协议具有较高的计算效率和可接受的通信开销。
[0027]本专利技术方法能够解决额外的信息泄露问题。例如,将该方法其应用到恶意内容检测场景中,设置标签数据为云端内容存储位置,则检测方(数据需求方)可以在不破坏用户(标签数据持有方)隐私的前提下获取恶意内容的位置并将其删除。同时,本专利技术方法对于图片检测监管以及其他一些需要使用类似功能的实际场景具有较好本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息保护增强的带标签隐私集合求交方法,其特征在于,包括如下步骤:(1)根据迪菲赫尔曼密钥协商的隐私集合求交协议变种,数据需求方在本地生成随机全排列π,并对标签数据持有方的中间数据进行乱序操作后发回至标签数据持有方;(2)数据需求方利用全排列信息π,对标签数据持有方处理后的下标信息执行乱序的逆过程,得到交集元素对应的原始下标;(3)利用不经意传输协议,数据需求方根据步骤(2)得到的下标获取交集数据对应的标签。2.根据权利要求1所述的一种信息保护增强的带标签隐私集合求交方法,其特征在于,所述步骤(1)包括如下子步骤:(1.1)数据需求方和标签数据持有方分别对各自的原始数据集合X和Y进行预处理,其中标签持有方仅处理求交数据x
i
∈X得到H(x
i
),其中函数H()表示哈希至椭圆曲线,所得结果H(x
i
)数乘本地私钥α得到αH(x
i
),将αH(x
i
)发送给数据需求方;数据需求方处理y
j
∈Y并数乘本地私钥k得到kH(y
j
),将kH(y
j
)放入布隆过滤器BF中;(1.2)数据需求方根据步骤(1.2)收到的数据量大小生成全排列π,对步骤(1.2)中收到的αH(x
i
)乱序得到αH(x
π(i)
),数乘自己的私钥后得到kαH(x
π(i)
),将kαH(x
π(i)
)与步骤(1.2)中生成的布隆过滤器BF一并发给标签持有方;(1.3)标签持有方根据步骤(1.2)中收到的kαH(x
π(i)
)横坐标,还原出纵坐标后计算kH(x
π(i)
)=α
‑1kαH(x
π(i)
),即为乱序后的密钥协商结果。3.根据权利要求2所述的一种信息保护增强的带标签隐私集合求交方法,其特征在于,所述步骤(1.1)中数据需求方和标签数据持有方分别对各自的原始数据集合X和Y进行预处理包括:将原始输入映射至椭圆...

【专利技术属性】
技术研发人员:张朱谷承秦湛任奎娄坚
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1