一种基于差分隐私保护的轨迹数据发布方法及系统技术方案

技术编号:30147722 阅读:21 留言:0更新日期:2021-09-25 14:53
本发明专利技术公开了一种基于差分隐私保护的轨迹数据发布方法及系统,方法通过获取一组目标个体的原始轨迹,然后根据原始轨迹获取一组目标泛化轨迹,并获取各目标泛化轨迹的计数,基于目标泛化轨迹的计数值构建填充计数矩阵,通过对该填充计数矩阵中的元素进行哈尔小波变换并添加拉普拉斯噪声,以获取重构计数矩阵,通过对重构计数矩阵进行一致性约束进而获取目标泛化轨迹计数矩阵。本发明专利技术提供的方法及系统,在保障数据可用性的前提下提高了轨迹数据的隐私保护程度。的隐私保护程度。的隐私保护程度。

【技术实现步骤摘要】
一种基于差分隐私保护的轨迹数据发布方法及系统


[0001]本专利技术涉及轨迹隐私保护
,具体涉及一种基于差分隐私保护的轨迹数据发 布方法及系统。

技术介绍

[0002]轨迹大数据是时空大数据的一个重要分支,由一系列带时间戳的坐标构成,时空序 列性是它相较于一般的时空大数据得以区别出来的一个显著特征。现如今移动互联网和 基于位置的服务(Location Based Service,LBS)得到了长足的发展,每时每刻都在 在产生轨迹数据。轨迹大数据蕴含着帮助社会解决交通、环境和资源等人类发展带来的 问题的潜力。在可以提供很大便利的同时,不幸的是它对用户的隐私构成了相当大的潜 在威胁。轨迹数据通常包含有关用户的敏感信息,海量的轨迹数据中包含着的是用户的 行为特征、个人爱好、健康状况和社会关系等隐私信息,肆意的发布和使用潜存着极大 的隐私暴露的风险。2014年数据科学家Tocher仅仅凭借公开数据和公开新闻上的知名 人士搭乘出租车的照片识别出了其行程的起/终点甚至是费用。
[0003]任何不经处理的轨迹数据发布都有可能会给用户带来灾难性的后果。潜在的隐私泄 露风险导致,无论是重视隐私保护的用户还是公司两方面都不愿提供和发布轨迹数据, 这大大限制了学界分析研究轨迹数据,分析造福公众的有价值信息的能力。实际上,在 没有任何保护的情况下的确只有很少的轨迹数据被发布出来。因此,迫切需要一种在保 障数据可用性的前提下,能够有力保护隐私的轨迹数据发布方案。

技术实现思路

[0004]专利技术目的:本专利技术提供一种在保障数据可用性的前提下,隐私保护程度高的轨迹数 据发布方法及系统。
[0005]技术方案:本专利技术提供的基于差分隐私保护的轨迹数据发布方法,用于获取在预设 时间段内目标群体在目标区域中移动的泛化轨迹、及泛化轨迹的计数,所述目标群体包 括多个目标个体;方法包括如下步骤:
[0006]步骤1:获取预设时间段内各目标个体在目标区域中的移动轨迹,将其作为原始轨 迹;然后进入步骤2;
[0007]步骤2:获取各原始轨迹分别在预设时间段内各预设时间戳下的位置坐标;
[0008]针对各原始轨迹上的所有位置坐标,按时间戳进行划分,获取各时间戳分别所对应 的位置坐标集合;
[0009]分别针对各位置坐标集合,将其作为待处理集合,对待处理集合中的各个坐标进行 聚类,获取该待处理集合所对应的各个簇,进而获取各位置坐标集合所对应的簇;
[0010]沿时间顺序,依次连接各时间戳所对应的簇的簇心,进而获取一组泛化轨迹,提取 其中与各原始轨迹相对应的泛化轨迹,将其作为原始泛化轨迹,剩余的作为备用泛化轨 迹;
[0011]然后进入步骤3;
[0012]步骤3:基于与各原始轨迹相对应的泛化轨迹,获取其中彼此不相同的各原始泛化 轨迹,将其作为非重复原始泛化轨迹,获取各非重复原始泛化轨迹的个数;自各备用泛 化轨迹中随机选取预设个数的泛化轨迹作为填充泛化轨迹:将各填充泛化轨迹的计数赋 值为零;将填充泛化轨迹和非重复泛化轨迹共同作为目标泛化轨迹,基于目标泛化轨迹 的计数构建填充计数矩阵M
(1)
;基于差分隐私噪声生成算法对填充计数矩阵M
(1)
进行哈 尔小波变换并添加拉普拉斯噪声,获取重构计数矩阵M';对重构计数矩阵M'进行一致 性约束进而获取目标泛化轨迹计数矩阵M”。
[0013]作为本专利技术的一种优选方案,在步骤3之后,所述方法还包括:
[0014]步骤4:将目标泛化轨迹和目标泛化轨迹计数矩阵M”一起发布。
[0015]作为本专利技术的一种优选方案,在步骤2中,使用K

means聚类算法对各坐标集合中 的坐标进行聚类。
[0016]作为本专利技术的一种优选方案,在步骤3中,获取重构计数矩阵M'的方法包括如下 步骤:
[0017]步骤3.1:根据各非重复原始泛化轨迹的个数构建初始计数矩阵M, M={tc
i
|i=1,...J'},tc
i
为初始计数矩阵M中的第i个元素,J'为非重复原始泛化轨迹的 个数;然后进入步骤3.2;
[0018]步骤3.2:自备用泛化轨迹中随机选出J

J'条填充泛化轨迹,各填充泛化轨迹的个 数为0;其中J为原始轨迹的个数;将各填充轨迹的个数作为填充元素加入计数矩阵M 中,获取填充计数矩阵M
(1)

[0019]使用0值作为补充元素,将填充计数矩阵M
(1)
中元素的数量补充至2
l
个,进而获取 元素补充后的矩阵;其中指数l是满足J≤2
l
的最小值;
[0020]然后进入步骤3.3;
[0021]步骤3.3:对元素补充后的矩阵进行一维哈尔小波变换进而获取小波系数矩阵C, 对小波系数矩阵中的每个元素添加对应的拉普拉斯噪声进而获取加噪小波系数矩阵C';
[0022]然后进入步骤3.4;
[0023]步骤3.4:基于加噪小波系数矩阵C'重构加噪计数矩阵,删除加噪计数矩阵中的补 充元素,进而获取重构计数矩阵M',M'={nc
i'
|i'=1,...J},nc
i'
为重构计数矩阵M'中的 第i'个元素。
[0024]作为本专利技术的一种优选方案,获取目标泛化轨迹计数矩阵M”的方法包括如下步骤:
[0025]步骤3.5:按照重构计数矩阵M'中各轨迹计数值的大小,对重构计数矩阵M'中的元 素进行排序,进而获取序列S;然后进入步骤3.6;
[0026]步骤3.6:根据如下公式:
[0027][0028]并结合约束条件L
m
=Q
m
,获取获取序列S中第m个元素的计数更新值L
m
,进而获 取序列S中各元素的计数更新值:
[0029]其中,Q
m
表示序列S中第m个元素的计数更新值L
m
的对应值;i”和j分别为序列S 中的第i”个元素和第j个元素,|S|表示序列S中元素的个数,mean[i”,j]表示序列S中 中第i”个元素至第j个元素的均值;
[0030]步骤3.7:基于各元素的计数更新值,构建泛化轨迹计数矩阵M”。
[0031]本专利技术还提供了一种基于差分隐私保护的轨迹数据发布系统,系统包括数据获取及 处理模块;所述数据获取及处理模块用于执行如下步骤:
[0032]步骤1:获取预设时间段内各目标个体在目标区域中的移动轨迹,将其作为原始轨 迹;
[0033]步骤2:获取各原始轨迹分别在预设时间段内各预设时间戳下的位置坐标;
[0034]针对各原始轨迹上的所有位置坐标,按时间戳进行划分,获取各时间戳分别所对应 的位置坐标集合;
[0035]分别针对各坐标集合,将其作为待处理集合,对待处理集合中的各个坐标进行聚类, 获取该待处理集合所对应的各个簇,进而获取各坐本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于差分隐私保护的轨迹数据发布方法,其特征在于,用于获取在预设时间段内目标群体在目标区域中移动的泛化轨迹、及泛化轨迹的计数,所述目标群体包括多个目标个体;方法包括如下步骤:步骤1:获取预设时间段内各目标个体在目标区域中的移动轨迹,将其作为原始轨迹;然后进入步骤2;步骤2:获取各原始轨迹分别在预设时间段内各预设时间戳下的位置坐标;针对各原始轨迹上的所有位置坐标,按时间戳进行划分,获取各时间戳分别所对应的位置坐标集合;分别针对各位置坐标集合,将其作为待处理集合,对待处理集合中的各个坐标进行聚类,获取该待处理集合所对应的各个簇,进而获取各位置坐标集合所对应的簇;沿时间顺序,依次连接各时间戳所对应的簇的簇心,进而获取一组泛化轨迹,提取其中与各原始轨迹相对应的泛化轨迹,将其作为原始泛化轨迹,剩余的作为备用泛化轨迹;然后进入步骤3;步骤3:基于与各原始轨迹相对应的泛化轨迹,获取其中彼此不相同的各原始泛化轨迹,将其作为非重复原始泛化轨迹,获取各非重复原始泛化轨迹的个数;自各备用泛化轨迹中随机选取预设个数的泛化轨迹作为填充泛化轨迹:将各填充泛化轨迹的计数赋值为零;将填充泛化轨迹和非重复泛化轨迹共同作为目标泛化轨迹,基于目标泛化轨迹的计数构建填充计数矩阵M
(1)
;基于差分隐私噪声生成算法对填充计数矩阵M
(1)
进行哈尔小波变换并添加拉普拉斯噪声,获取重构计数矩阵M';对重构计数矩阵M'进行一致性约束进而获取目标泛化轨迹计数矩阵M”。2.根据权利要求1所述的基于差分隐私保护的轨迹数据发布方法,其特征在于,在步骤3之后,所述方法还包括:步骤4:将目标泛化轨迹和目标泛化轨迹计数矩阵M”一起发布。3.根据权利要求1所述的基于差分隐私保护的轨迹数据发布方法,其特征在于,在步骤2中,使用K

means聚类算法对各坐标集合中的坐标进行聚类。4.根据权利要求1所述的基于差分隐私保护的轨迹数据发布方法,其特征在于,在步骤3中,获取重构计数矩阵M'的方法包括如下步骤:步骤3.1:根据各非重复原始泛化轨迹的个数构建初始计数矩阵M,M={tc
i
|i=1,...J'},tc
i
为初始计数矩阵M中的第i个元素,J'为非重复原始泛化轨迹的个数;然后进入步骤3.2;步骤3.2:自备用泛化轨迹中随机选出J

J'条填充泛化轨迹,各填充泛化轨迹的个数为0;其中J为原始轨迹的个数;将各填充轨迹的个数作为填充元素加入计数矩阵M中,获取填充计数矩阵M
(1)
;使用0值作为补充元素,将填充计数矩阵M
(1)
中元素的数量补充至2
l
个,进而获取元素补充后的矩阵;其中指数l是满足J≤2
l
的最小值;然后进入步骤3.3;步骤3.3:对元素补充后的矩阵进行一维哈尔小波变换进而获取小波系数矩阵C,对小波系数矩阵中的每个元素添加对应的拉普拉斯噪声进而获取加噪小波系数矩阵C';然后进入步骤3.4;
步骤3.4:基于加噪小波系数矩阵C'重构加噪计数矩阵,删除加噪计数矩阵中的补充元素,进而获取重构计数矩阵M',M'={nc
i'
|i'=1,...J},nc
i'
为重构计数矩阵M'中的第i'个元素。5.根据权利要求4所述的基于差分隐私保护的轨迹数据发布方法,其特征在于,获取目标泛化轨迹计数矩阵M”的方法包括如下步骤:步骤3.5:按照重构计数矩阵M'中各轨迹计数值的大小,对重构计数矩阵M'中的元素进行排序,进而获取序列S;然后进入步骤3.6;步骤3.6:根据如下公式:并结合约束条件L
m
=Q
m
,获取获取序列S中第m个元素的计数更新值L
m
,进而获取序列S中各元素的计数更新值:其中,Q
m
表示序列S中第m个元素的计数更新值L
m
的对应值;i”和j分别为序列S中的第i”个元素和第j个元素,|S|表示序列S中元素的个数,mean[i”,j]表示序列S中中第i”个元素至第j个元素的均值;步骤3.7:基于各元素的计数更新值,构建泛化轨迹计数矩阵M”。6.一种基于差分隐私保护的轨迹数据...

【专利技术属性】
技术研发人员:徐小龙孔诚恺段卫华
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1