当前位置: 首页 > 专利查询>湖南大学专利>正文

基于拉格朗日优化的轨迹间相关性隐私保护方法技术

技术编号:18861399 阅读:19 留言:0更新日期:2018-09-05 14:40
本发明专利技术公开了一种基于拉格朗日优化的轨迹间相关性隐私保护方法。本发明专利技术提出了一种轨迹间相关性的隐私保护方法,在给定数据有用性的情况下,提供了更大力度的隐私保护,并且在同等隐私保护力度下,使得数据有用性更高。

Privacy preserving method of trajectory correlation based on Lagrange optimization

The invention discloses a path correlation privacy protection method based on Lagrange optimization. The invention provides a privacy protection method of correlation between trajectories, which provides greater privacy protection under given data availability, and makes data more useful under the same privacy protection intensity.

【技术实现步骤摘要】
基于拉格朗日优化的轨迹间相关性隐私保护方法
本专利技术属于计算机领域,尤其涉及一种基于拉格朗日优化的轨迹间相关性隐私保护方法。
技术介绍
两用户的轨迹间相关性可直接应用于许多现应用程序,例如,产品推荐和社交媒体。虽然轨迹间相关性可带来许多好处,但是由于轨迹间相关性可暗示某些社交关系,因此发布相关的轨迹可造成敏感社交关系的泄露。目前,针对轨迹间相关性的隐私保护方法,未见其相关报道。我们首次提出轨迹间相关性隐私保护方法,在给定数据有用性的情况下,可提供更大力度的隐私保护。并且,与现有的方法相比,我们提出的方法数据有用性更高,隐私保护力度更强。名词解释:n体拉普拉斯框架:对一天内具有n个时间点的轨迹一次性添加n个噪声,并且每个噪声都服从拉普拉斯分布。隐私预算:一种隐私保护力度的表现形式,设定的值越小,隐私保护力度越大。位置有用性:一种通过绝对距离偏差来衡量数据有用性的方法。位置相关性有用性:一种运用两用户间经度和纬度的相关系数来衡量数据有用性的方法。
技术实现思路
为解决上述问题,本专利技术提供了一种基于拉格朗日优化的轨迹间相关性隐私保护方法。本专利技术提出了一种轨迹间相关性的隐私保护方法,在给定数据有用性情况下,可提供更大力度的隐私保护,在同等隐私保护力度下,数据有用性更高。为达到上述技术效果,本专利技术的技术方案是:一种基于拉格朗日优化的轨迹间相关性隐私保护方法,包括如下步骤:步骤一:将用户的原始轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”,“每天的轨迹”具有n个采样时间点;步骤二:针对每天的轨迹,运用n体拉普拉斯框架,通过生成服从拉普拉斯分布的噪声集合,并将集合中噪声依据时间顺序分别添加到原始轨迹上,从而实现轨迹间相关性隐私保护;并且n体拉普拉斯框架满足以下不等式:其中,表示,在θρ分布的条件下,属于集合的概率;表示运用S机制查询所得到的结果,表示加噪声之后的一个轨迹距离;表示,在θρ分布的条件下,属于集合的概率;表示运用S机制查询所得到的结果,表示加噪声之后的另一个轨迹距离;和有且仅有一个时间点上的位置距离不同;θρ是所有可能的位置相关性的分布;位置相关性表示第i个时间点上经度x的相关系数,表示第i个时间点上纬度y的相关系数;为第m个时间点上经度x的隐私保护预算,第m个时间点上纬度y的隐私保护预算,为第i个时间点上经度的隐私保护预算,第i个时间点上纬度的隐私保护预算;步骤三:当应用场景不需要利用用户位置间相关关系的时候,根据位置有用性,来净化处理两个用户的轨迹,以实现轨迹间相关性;位置有用性是通过绝对距离偏差来衡量数据有用性的方法,通过计算经度和纬度上噪声的期望之和的平均值,表达式为:其中,和分别为第i个时间点上用户的经度x和纬度y所添加的噪声,ud表示位置有用性,d表示位置有用性的下标;E()表示或绝对值的期望的运算符;面向位置有用性时,两个用户的隐私保护处理步骤如下:一、输入原始数据:输入用户a和用户b的原始轨迹集合以及给定的位置有用性ud=ud,其中,ud的取值由用户依据需求来设定;ud值越大越数据有用性越低,越小越数据有用性越高;二、计算原始轨迹距离:将用户a和用户b用户轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为其中,和分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,和分别为用户a和b在第i个时间点上的经度,和分别为用户a和b在第i个时间点上的纬度;三、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:S=S(x)S(y),其中,R表示决定相关性范围的参数,由用户根据需求设定;四、计算面向位置有用性情况下的拉格朗日乘数因子λd:首先,构建拉格朗日约束条件,其表达式为:从而可得,与归一化轨迹距离和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数,标记为然后,通过牛顿拉弗森方法来求解计算得拉格朗日乘数因子λd。其中,为归一化的第i个时间点上拉普拉斯分布尺度参数,表示面向位置有用性情况下第i个时间点上的拉普拉斯分布尺度参数;五、计算归一化的拉普拉斯分布尺度参数的集合运用拉格朗日乘数法,求解满足拉格朗日约束条件;的所有的即得由组成的集合六、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:表示净化处理后用户a的轨迹,表示净化处理后用户b的轨迹;步骤四:当应用场景需要利用用户位置间相关关系的时候,根据位置相关性有用性来净化处理两个用户的轨迹,以实现轨迹间相关性隐私保护;位置相关性有用性是运用两用户间经度和纬度的相关系数来衡量数据有用性的方法,其表达式为:其中,和分别为在第i个时间点上加入噪声前后经度的相关系数,和分别为在第i个时间点上加入噪声前后纬度的相关系数,uc表示位置有用性,c表示位置相关性有用性的下标;面向位置相关性有用性时,两个用户的隐私保护处理步骤如下:一、输入原始数据:输入两个用户的原始轨迹集合以及位置相关性有用性uc=uc;c表示位置相关性有用性的下标;0≤uc≤1,由客户根据需要进行选取;uc值越大越数据有用性越低,越小越数据有用性越高。二、计算相关系数集合:获取用户a和用户b原始轨迹中每个时间点上经度的相关系数集合ρx和每个时间点上纬度的相关系数集合ρy;三、计算原始轨迹距离:将用户a和用户b用户轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为其中,和分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,和分别为用户a和b在第i个时间点上的经度,和分别为用户a和b在第i个时间点上的纬度;四、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:S=S(x)S(y),其中,R表示决定相关性范围的参数,由用户根据需求设定,一般的,表示所有天数中第i个时间点上经度上的位置距离的标准差,表示所有天数中第i个时间点上纬度上的位置距离的标准差;五、计算面向位置相关性有用性情况下的拉格朗日乘数因子λc:首先,构建拉格朗日约束条件,其表达式为:从而可得,与归一化位置相关性和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数。然后,通过牛顿拉弗森方法来求解计算得拉格朗日乘数因子λc。其中,为归一化的第i个时间点上拉普拉斯分布尺度参数,表示面向位置相关性有用性情况下第i个时间点上的拉普拉斯分布尺度参数;六、计算归一化的拉普拉斯分布尺度参数的集合运用拉格朗日乘数法,求解满足拉格朗日约束条件的所有的即得由组成的集合七、净化处理原始轨迹:将服从拉普拉斯分布的噪声添加到原始轨迹上,以实现轨迹间相关性隐私保护,其操作如下所示:表示净化处理后用户a的轨迹,表示净化处理后用户b的轨迹;进一步的改进,需要利用用户位置间相关关系的应用场景包括广告推荐应用场景。进一步的改进,所述步骤三中,ud的取值为位置标准差的平均值的三倍,即进一步的改进,所述步骤三中,表示所有天数中第i个时间点上经度上位置距离的标准差,表示所有天数本文档来自技高网...

【技术保护点】
1.一种基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,包括如下步骤:步骤一:将用户的原始轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”,“每天的轨迹”具有n个采样时间点;步骤二:针对每天的轨迹,运用n体拉普拉斯框架,通过生成服从拉普拉斯分布的噪声集合,并将集合中噪声依据时间顺序分别添加到原始轨迹上,从而实现轨迹间相关性隐私保护;并且n体拉普拉斯框架满足以下式子:

【技术特征摘要】
1.一种基于拉格朗日优化的轨迹间相关性隐私保护方法,其特征在于,包括如下步骤:步骤一:将用户的原始轨迹以天为单位,划分为多条子轨迹,称为“每天的轨迹”,“每天的轨迹”具有n个采样时间点;步骤二:针对每天的轨迹,运用n体拉普拉斯框架,通过生成服从拉普拉斯分布的噪声集合,并将集合中噪声依据时间顺序分别添加到原始轨迹上,从而实现轨迹间相关性隐私保护;并且n体拉普拉斯框架满足以下式子:其中,表示在θρ分布的条件下,属于集合的概率;表示运用S机制查询所得到的结果,表示加噪声之后的一个轨迹距离;表示,在θρ分布的条件下,属于集合的概率;表示运用S机制查询所得到的结果,表示加噪声之后的另一个轨迹距离;和有且仅有一个时间点上的位置距离不同;θρ是所有可能的位置相关性的分布;位置相关性表示第i个时间点上经度x的相关系数,表示第i个时间点上纬度y的相关系数;为第m个时间点上经度x的隐私保护预算,第m个时间点上纬度y的隐私保护预算,为第i个时间点上经度的隐私保护预算,第i个时间点上纬度的隐私保护预算;步骤三:当应用场景不需要利用用户位置间相关关系的时候,根据位置有用性,来净化处理两个用户的轨迹,以实现轨迹间相关性;位置有用性是通过绝对距离偏差来衡量数据有用性的方法,通过计算经度和纬度上噪声的期望之和的平均值,表达式为:其中,和分别为第i个时间点上用户的经度x和纬度y所添加的噪声,表示位置有用性,d表示位置有用性的下标;E()表示或绝对值的期望的运算符;面向位置有用性时,两个用户的隐私保护处理步骤如下:一、输入原始数据:输入用户a和用户b的原始轨迹集合以及给定的位置有用性其中,ud的取值由用户依据需求来设定;二、计算原始轨迹距离:将用户a和用户b轨迹中每个时间点上经度和纬度依次相减,得到的集合为原始轨迹距离,标记为其中,和分别为两用户的经度上位置距离和纬度上位置距离,i为一天中第i个时间点,x为经度,y为纬度,和分别为用户a和b在第i个时间点上的经度,和分别为用户a和b在第i个时间点上的纬度;三、计算用户a和用户b的轨迹相关性分数S:轨迹相关性分数S是一种运用轨迹距离来测量同一天两条轨迹间相关性的测量方法,该方法为一个关于轨迹距离的指数函数,其表达式为:S=S(x)S(y),其中,R表示决定相关性范围的参数,由用户根据需求设定;四、计算面向位置有用性情况下的拉格朗日乘数因子λd:首先,构建拉格朗日约束条件,其表达式为:从而可得,与归一化轨迹距离和拉格朗日乘数因子相关的归一化拉普拉斯分布尺度参数的函数,标记为然后,通过牛顿拉弗森方法来求解计算得拉格朗日乘数因子λd。其中,为归一化的第i个时间点上拉普拉斯分布尺度参数,表示面向位置有用性情况下第i个时间点上的拉普拉斯分布尺度参数;五、计算归一化的拉普拉斯分布尺度参数的集合运用拉格朗日乘数法,求解满足拉格朗日约束条件:的所有的即得,由组成的集合六、净化处理原始轨迹:将服从拉普拉斯...

【专利技术属性】
技术研发人员:欧露秦拯胡娟
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1