【技术实现步骤摘要】
一种空间众包中保护工人语义隐私的方法和系统
[0001]本专利技术属于空间众包隐私保护
,更具体地,涉及一种空间众包中保护工人语义隐私的方法和系统。
技术介绍
[0002]隐私保护是空间众包领域的四大核心问题之一,空间众包平台执行空间众包服务,会先获取到工人和任务的信息,并根据这些信息进行任务分配,在任务分配之前,需要获取工人的位置信息,其位置包含个人敏感信息,如用户的生活习惯、健康状态等,如若在这个过程中,工人的信息未经过处理直接提交给平台,其个人信息则会泄露给众包平台,导致工人的位置隐私泄露,如果隐私受到侵犯,移动用户可能不会同意参与空间众包活动,因此,确保位置隐私是空间众包成功的关键。当下空间众包的隐私保护技术均是对移动用户位置坐标进行保护,然而用户的位置信息不仅是地图中某个位置坐标,各种基础设施位于这些位置,比如商店、公交站、医院和学校等。这些基础设施可以被视为位置语义,如果这种信息不能得到适当的处理,它们可能会泄露更多移动用户的个人或企业秘密,而不是简单的坐标,将移动用户的位置语义暴露给敌对广告商和基于位置的垃圾邮件,可能导致社会声誉或经济损失,甚至是身体暴力。因此一个在空间众包中保护工人位置坐标以及语义隐私的方法有着较大的显示意义。
[0003]目前应用在空间众包领域的隐私保护方法,包括考虑工人位置坐标的隐私保护方法、以及位置语义的隐私保护方法。
[0004]现有的工人位置坐标隐私保护方法主要是基于差分隐私来实现的,第一种方法是基于差分隐私的隐私保护方案,根据真实工人数据集将隐私空间
【技术保护点】
【技术特征摘要】
1.一种空间众包中保护工人语义隐私的方法,其特征在于,包括如下步骤:(1)获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;(2)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;(3)获取任务位置坐标,根据该位置坐标以及步骤(2)构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配。2.根据权利要求1所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(1)具体为,首先是获取点数据集,并确定其对应的基础语义;随后,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;其后,根据得到的多个子语义构建一个三层语义树模型;最后,确定三层语义树模型对应的语义权值,并结合标准差的定义确定网格语义相似度。3.根据权利要求1或2所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(1)具体包括以下子步骤:(1
‑
1)获取点数据集,并确定其对应的基础语义,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;(1
‑
2)对步骤(1
‑
1)获取的多个子语义确定基础语义的权值范围,以及每个子语义的权值,进而得到一个三层语义树模型,如图3所示。(1
‑
3)利用步骤(1
‑
2)获取到的三层语义树模型并结合标准差的定义获取网格语义相似度。4.根据权利要求1至3中任意一项所述的空间众包中保护工人语义隐私的方法,其特征在于,基础语义的权值范围为:其中T表示自定义划分范围,|S|表示基础语义的总数,λ表示基础语义的编号,且有λ∈[1,步骤(1
‑
1)得到的基础语义总数];对应子语义的权值等于:
其中,表示子语义所对应的权值,λ表示基础语义的编号,i表示子语义的编号且该子语义属于编号为λ的基础语义,其中i∈[1,步骤(1
‑
1)得到的子语义总数],M和N是两个常数,其中M表示子语义为的位置总数,N表示基础语义为s
λ
的位置总数,表示子语义为的位置点,表示编号为i的子语义且该子语义属于编号为λ的基础语义,j为一个计数器,表示子语义为的位置序号(如表示子语义为的位置点中第j个位置点),且有j∈[1,M],loc
k
(s
λ
)表示基础语义为s
λ
的位置点,s
λ
表示编号为λ的基础语义,k表示基础语义为s
λ
的位置点序号,且有k∈[1,N];网格语义相似度为:其中,Sim为网格语义相似度,N1为常数,其表示网格中的位置点总数,表示在网格中的第j1个位置点,其中j1∈[1,N1],表示位置点的对应子语义权值,Sim值越小,表示网格语义相似度越高,反之亦然。5.根据权利要求4所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(2)具体包括以下子步骤:(2
‑
1)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域,并获取选中区域内的工人位置信息,包括位置坐标和位置语义;(2
‑
2)利用(2
‑
1)获取到的选中区域内的工人位置信息,对该选中区域进行网格划分,以得到第一层网格,并根据第一层网格的隐私预算∈1添加拉普拉斯随机噪声到第一层网格中,以得到加噪后的第一层网格;(2
‑
3)根据步骤(2
‑
2)获取到加噪后的第一层网格,计算第一层网格的网格语义相似度,确定网格语义相似度阈值θ1,并根据θ1对第一层网格进行重组,以得到经重组后的第一层网格。(2
‑
4)对步骤(2
‑
3)获取到的重组后的第一层网格,确定网格语义相似度阈值θ2,根据θ2对第一层网格进行分割,得到经分割后的第二层网格,再根据第二层网格的隐私预算∈2,添加拉普拉斯随机噪声到第二层网格中,以得到加噪后的第二层网格。(2
‑
5)根据步骤(2
‑
4)获取到加噪后的第二层网格,计算第二层网格的网格语义相似度,并对网格语义相似度小于θ1的第二层网格进行重组。6.根据权利要求5所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(2
‑
2)具体为,首先,根据工人位置信息获取选中区域内的工人总数,并根据工人总数确定第一层网格的划分粒度m1,根据第一层网格的划分粒度将选中区域划分为m1×
m1的第一层网格;具体而言,粒度m1为:
其中,N(C)为选中区域内的工人总数,∈为全部隐私预算,其中∈∈(0,1),k1是一个常数,其取值为10。随后,在第一层网格划分完成后,确定第一层网格的隐私预算∈1,其中∈1=∈
×
α,α表示隐私预算分配比率,且α∈(0,1)),然后,根据第一层网格的隐私预算∈1,添加拉普拉斯随机噪声到第一层网格中,并确定第一层网格的噪声计数,噪声计数为:其中Q(D)表示真实工人数,表示在的范围内服从Laplace分布的一个随机噪声,以得到加噪后的第一层网格。步骤(2
‑
3)具体为,首先,计算第一层网格中每个网格对应的网格语义相似度,确定网格语义相似度阈值θ1,随后,根据θ1对第一层网格进行重组,...
【专利技术属性】
技术研发人员:周旭,陈思,杨志邦,任天悦,李肯立,
申请(专利权)人:湖南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。