当前位置: 首页 > 专利查询>湖南大学专利>正文

一种空间众包中保护工人语义隐私的方法和系统技术方案

技术编号:38139511 阅读:26 留言:0更新日期:2023-07-08 09:53
本发明专利技术公开了一种空间众包中保护工人语义隐私的方法,包括:获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度,根据三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构,获取任务位置坐标,根据该位置坐标以及隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配。完成任务分配。完成任务分配。

【技术实现步骤摘要】
一种空间众包中保护工人语义隐私的方法和系统


[0001]本专利技术属于空间众包隐私保护
,更具体地,涉及一种空间众包中保护工人语义隐私的方法和系统。

技术介绍

[0002]隐私保护是空间众包领域的四大核心问题之一,空间众包平台执行空间众包服务,会先获取到工人和任务的信息,并根据这些信息进行任务分配,在任务分配之前,需要获取工人的位置信息,其位置包含个人敏感信息,如用户的生活习惯、健康状态等,如若在这个过程中,工人的信息未经过处理直接提交给平台,其个人信息则会泄露给众包平台,导致工人的位置隐私泄露,如果隐私受到侵犯,移动用户可能不会同意参与空间众包活动,因此,确保位置隐私是空间众包成功的关键。当下空间众包的隐私保护技术均是对移动用户位置坐标进行保护,然而用户的位置信息不仅是地图中某个位置坐标,各种基础设施位于这些位置,比如商店、公交站、医院和学校等。这些基础设施可以被视为位置语义,如果这种信息不能得到适当的处理,它们可能会泄露更多移动用户的个人或企业秘密,而不是简单的坐标,将移动用户的位置语义暴露给敌对广告商和基于位置的垃圾邮件,可能导致社会声誉或经济损失,甚至是身体暴力。因此一个在空间众包中保护工人位置坐标以及语义隐私的方法有着较大的显示意义。
[0003]目前应用在空间众包领域的隐私保护方法,包括考虑工人位置坐标的隐私保护方法、以及位置语义的隐私保护方法。
[0004]现有的工人位置坐标隐私保护方法主要是基于差分隐私来实现的,第一种方法是基于差分隐私的隐私保护方案,根据真实工人数据集将隐私空间划分为两层网格结构,并采用噪声机制添加噪声,从而保证了工人位置坐标的隐私;第二种方法也是基于差分隐私的保护方案,该方案采用自适应三级网格分解和自适应完全金字塔分解,将工人和任务的位置划分到多层网格当中并添加噪声,从而考虑到了网格粒度与位置坐标隐私。
[0005]现有的位置语义隐私保护方法主要是应用在基于位置服务和道路网方面,第一种是属性感知的隐私保护方案,用于增加移动用户的位置语义隐私,该方案从局部映射中提取基本属性,并构建了基于属性的层次结构,基于这些信息将局部地区划分为不同的多边形,再通过四色图进行着色,构造位置查询集,以保护位置语义隐私;第二种方法是基于语义感知的隐私保护模型(CloSed),通过设计一种覆盖道路网络不同语义区域并满足服务质量的隐藏集,采用一种贪婪算法来平衡服务质量与隐私要求,以保护路网位置语义隐私。
[0006]然而,上述方法都存在一些不可忽略的缺陷:基于差分隐私的空间众包工人隐私保护方法,并未考虑语义条件,在隐私空间构建的过程中,当区域位置语义较为相近、甚至单一时,区域划分出的均匀网格中可能存在网格语义单一的情况,进而泄露工人位置语义隐私,若基于语义构建隐私空间,需要考虑如何度量位置语义之间的差异性,以及不同的任务分配方法等;关于位置语义隐私的保护方案主要在基于位置的服务与道路网方面应用,未考虑在空间众包中的应用场景,而空间众包中工人的位置语义亦是敏感信息,该信息的
泄露也会导致用户对平台失去信任。

技术实现思路

[0007]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种空间众包中保护工人语义隐私的方法,其目的在于,解决在空间众包中基于语义的隐私保护方法中无法度量隐私空间语义的问题,以及现有基于差分隐私的空间隐私保护方法中工人位置语义隐私泄露的问题,以及基于语义构建隐私空间的任务分配问题,以及语义隐私在空间众包没有相关应用的问题。
[0008]为实现上述目的,按照本专利技术的一个方面,提供了一种空间众包中保护工人语义隐私的方法,包括如下步骤:
[0009](1)获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;
[0010](2)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;
[0011](3)获取任务位置坐标,根据该位置坐标以及步骤(2)构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配。
[0012]优选地,步骤(1)具体为,首先是获取点数据集,并确定其对应的基础语义;随后,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;其后,根据得到的多个子语义构建一个三层语义树模型;最后,确定三层语义树模型对应的语义权值,并结合标准差的定义确定网格语义相似度。
[0013]优选地,步骤(1)具体包括以下子步骤:
[0014](1

1)获取点数据集,并确定其对应的基础语义,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;
[0015](1

2)对步骤(1

1)获取的多个子语义确定基础语义的权值范围,以及每个子语义的权值,进而得到一个三层语义树模型,如图3所示。
[0016](1

3)利用步骤(1

2)获取到的三层语义树模型并结合标准差的定义获取网格语义相似度。
[0017]优选地,基础语义的权值范围为:
[0018][0019]其中T表示自定义划分范围,|S|表示基础语义的总数,λ表示基础语义的编号,且有λ∈[1,步骤(1

1)得到的基础语义总数];
[0020]对应子语义的权值等于:
[0021][0022]其中,表示子语义所对应的权值,λ表示基础语义的编号,i表示子语义的编号且该子语义属于编号为λ的基础语义,其中i∈[1,步骤(1

1)得到的子语义总数],M和N是两个常数,其中M表示子语义为的位置总数,N表示基础语义为s
λ
的位置总数,表示子语义为的位置点,表示编号为i的子语义且该子语义属于编号为λ的基础语义,j为一个计数器,表示子语义为的位置序号(如表示子语义为的位置点中第j个位置点),且有j∈[1,M],loc
k
(s
λ
)表示基础语义为s
λ
的位置点,s
λ
表示编号为λ的基础语义,k表示基础语义为s
λ
的位置点序号,且有k∈[1,N];
[0023]网格语义相似度为:
[0024][0025]其中,Sim为网格语义相似度,N1为常数,其表示网格中的位置点总数,表示在网格中的第j1个位置点,其中j1∈[1,N1],表示位置点的对应子语义权值,Sim值越小,表示网格语义相似度越高,反之亦然。
[0026]优选地,步骤(2)具体包括以下子步骤:
[0027](2...

【技术保护点】

【技术特征摘要】
1.一种空间众包中保护工人语义隐私的方法,其特征在于,包括如下步骤:(1)获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;(2)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;(3)获取任务位置坐标,根据该位置坐标以及步骤(2)构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配。2.根据权利要求1所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(1)具体为,首先是获取点数据集,并确定其对应的基础语义;随后,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;其后,根据得到的多个子语义构建一个三层语义树模型;最后,确定三层语义树模型对应的语义权值,并结合标准差的定义确定网格语义相似度。3.根据权利要求1或2所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(1)具体包括以下子步骤:(1

1)获取点数据集,并确定其对应的基础语义,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;(1

2)对步骤(1

1)获取的多个子语义确定基础语义的权值范围,以及每个子语义的权值,进而得到一个三层语义树模型,如图3所示。(1

3)利用步骤(1

2)获取到的三层语义树模型并结合标准差的定义获取网格语义相似度。4.根据权利要求1至3中任意一项所述的空间众包中保护工人语义隐私的方法,其特征在于,基础语义的权值范围为:其中T表示自定义划分范围,|S|表示基础语义的总数,λ表示基础语义的编号,且有λ∈[1,步骤(1

1)得到的基础语义总数];对应子语义的权值等于:
其中,表示子语义所对应的权值,λ表示基础语义的编号,i表示子语义的编号且该子语义属于编号为λ的基础语义,其中i∈[1,步骤(1

1)得到的子语义总数],M和N是两个常数,其中M表示子语义为的位置总数,N表示基础语义为s
λ
的位置总数,表示子语义为的位置点,表示编号为i的子语义且该子语义属于编号为λ的基础语义,j为一个计数器,表示子语义为的位置序号(如表示子语义为的位置点中第j个位置点),且有j∈[1,M],loc
k
(s
λ
)表示基础语义为s
λ
的位置点,s
λ
表示编号为λ的基础语义,k表示基础语义为s
λ
的位置点序号,且有k∈[1,N];网格语义相似度为:其中,Sim为网格语义相似度,N1为常数,其表示网格中的位置点总数,表示在网格中的第j1个位置点,其中j1∈[1,N1],表示位置点的对应子语义权值,Sim值越小,表示网格语义相似度越高,反之亦然。5.根据权利要求4所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(2)具体包括以下子步骤:(2

1)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域,并获取选中区域内的工人位置信息,包括位置坐标和位置语义;(2

2)利用(2

1)获取到的选中区域内的工人位置信息,对该选中区域进行网格划分,以得到第一层网格,并根据第一层网格的隐私预算∈1添加拉普拉斯随机噪声到第一层网格中,以得到加噪后的第一层网格;(2

3)根据步骤(2

2)获取到加噪后的第一层网格,计算第一层网格的网格语义相似度,确定网格语义相似度阈值θ1,并根据θ1对第一层网格进行重组,以得到经重组后的第一层网格。(2

4)对步骤(2

3)获取到的重组后的第一层网格,确定网格语义相似度阈值θ2,根据θ2对第一层网格进行分割,得到经分割后的第二层网格,再根据第二层网格的隐私预算∈2,添加拉普拉斯随机噪声到第二层网格中,以得到加噪后的第二层网格。(2

5)根据步骤(2

4)获取到加噪后的第二层网格,计算第二层网格的网格语义相似度,并对网格语义相似度小于θ1的第二层网格进行重组。6.根据权利要求5所述的空间众包中保护工人语义隐私的方法,其特征在于,步骤(2

2)具体为,首先,根据工人位置信息获取选中区域内的工人总数,并根据工人总数确定第一层网格的划分粒度m1,根据第一层网格的划分粒度将选中区域划分为m1×
m1的第一层网格;具体而言,粒度m1为:
其中,N(C)为选中区域内的工人总数,∈为全部隐私预算,其中∈∈(0,1),k1是一个常数,其取值为10。随后,在第一层网格划分完成后,确定第一层网格的隐私预算∈1,其中∈1=∈
×
α,α表示隐私预算分配比率,且α∈(0,1)),然后,根据第一层网格的隐私预算∈1,添加拉普拉斯随机噪声到第一层网格中,并确定第一层网格的噪声计数,噪声计数为:其中Q(D)表示真实工人数,表示在的范围内服从Laplace分布的一个随机噪声,以得到加噪后的第一层网格。步骤(2

3)具体为,首先,计算第一层网格中每个网格对应的网格语义相似度,确定网格语义相似度阈值θ1,随后,根据θ1对第一层网格进行重组,...

【专利技术属性】
技术研发人员:周旭陈思杨志邦任天悦李肯立
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1