The invention discloses a position data protection method based on vector position before, because of the location data of high dimension, spatial correlation, and background knowledge rich features, the privacy protection data faces different challenges with the traditional privacy protection, according to the position data privacy protection, the invention uses the method of differential privacy protection starting from the vector, respectively adding random noise to the two dimensions of distance and angle, realize differential privacy protection. The position data released after the differential privacy protection not only protects the personal privacy of the user, but also ensures the availability of the location data.
【技术实现步骤摘要】
一种基于前位置矢量的差分隐私保护方法
本专利技术属于隐私保护
,更具体地,涉及一种基于前位置矢量的差分隐私保护方法。
技术介绍
近年来,基于位置的服务以及各种定位技术得到了广泛使用,其中有大量的用户位置数据被收集。为了更好地利用位置数据中蕴藏的学术价值和商业价值,积累的用户位置数据被发布给学术和商业机构,用于进行城市规划、行为模式分析、商业决策等研究。如何使位置数据发布中的个人隐私得到有效保护,逐渐成为研究的热点。而位置数据的高维度、时空相关性、以及背景知识丰富等特点,使得位置数据的隐私保护面临着与传统隐私保护不同的挑战。目前常见的基于位置数据的隐私保护方法主要有以下三种:1、轨迹抑制技术轨迹抑制技术原理是不发布所有的轨迹或者一条轨迹上的所有节点。如果轨迹上某个节点含有大量敏感信息,发布出去会使轨迹隐私泄漏的威胁变大,那么我们将抑制这些节点的发布,在去掉这些敏感节点后,再发布轨迹数据。有些极端情况下,整条轨迹都是敏感度非常高的,那么直接将这条轨迹从轨迹数据库中剔除掉。也有这种情况:聚类结束时,会出现若干条轨迹并不被某一个等价类包括,此时,只有把这整条轨迹都剔除掉。2、轨迹泛化技术面向存储在关系型数据库中的数据,在数据发布阶段,通常把确定的数变成了包含这个数的一个区间,这样泛化之后,攻击者就无法得知具体的数值。例如,Jack的年龄本来是确定的58岁,但是却可以用一个区间[50-59]表示。受到启示,当研究轨迹隐私保护时,也可以用适当的一片空间大小来表示某一个具体的点。3、假轨迹数据保护技术在不让发布的轨迹数据失去某些统计特性前提下,往待发布原始轨迹数据 ...
【技术保护点】
一种基于前位置矢量的差分隐私保护方法,其特征在于,包括以下步骤:(1)获取多个位置数据构成的轨迹曲线,并对该轨迹曲线进行采样,以得到采样点集合T={(X0,Y0),(X1,Y1),…,(Xn,Yn)};其中n表示采样点的数量,X和Y分别表示采样点的横坐标和纵坐标;(2)设置计数器i=1;(3)判断i是否小于等于n,如果是则转入步骤(4),否则进入步骤(9);(4)根据采样点集合T获得中间向量Vi=(Xi‑X
【技术特征摘要】
1.一种基于前位置矢量的差分隐私保护方法,其特征在于,包括以下步骤:(1)获取多个位置数据构成的轨迹曲线,并对该轨迹曲线进行采样,以得到采样点集合T={(X0,Y0),(X1,Y1),…,(Xn,Yn)};其中n表示采样点的数量,X和Y分别表示采样点的横坐标和纵坐标;(2)设置计数器i=1;(3)判断i是否小于等于n,如果是则转入步骤(4),否则进入步骤(9);(4)根据采样点集合T获得中间向量Vi=(Xi-X*i-1,Yi-Y*i-1),并获得中间向量Vi的模和角度,其中X*和Y*分别表示采样点经过扰动后的横坐标和纵坐标,且X*0=X0,Y*0=Y0;(5)根据中间向量Vi的模获取拉普拉斯分布函数,求取该拉普拉斯分布函数的反函数,并根据该反函数获取随机值ρi;(6)根据中间向量Vi的角度获取拉普拉斯分布函数,求取该拉普拉斯分布函数的反函数,并根据该反函数获取随机值αi;(7)根据步骤(5)和步骤(6)获取的随机值ρi和αi得到采样点经过扰动后的横坐标和纵坐标X*i和Y*i;(8)设置i=i+1,并返回步骤(3);(9)根据扰动后的新采样点集合T*={(X*0,Y*0),(X*1,Y*1),…,(X*n,Y*n)}获得对应的轨迹曲线,并将该轨迹曲线作为隐私数据发布在公开平台上。2.根据权利要求1所述的差分隐私保护方法,其特征在于,对轨迹曲线进行采样的周期为1秒。3.根据权利要求1所述的差分隐私保护方法,其特征在于,中间向量Vi的模ri=|Vi|,中间向量Vi的角度θi=Arg(Vi)。4.根据权利要求1所述的差分隐私保护方法,其特征在于,根据中间向量Vi的模获取拉普拉斯分布函数为:其中随机数ρi∈[0,2M],ε表示预定义的隐私参数,M表示相邻坐标点之间最大距离的一半。5.根据权利要求1所述的差分隐私保护方法,其特征在...
【专利技术属性】
技术研发人员:周可,王桦,唐文君,汪洋涛,李晓翠,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。