当前位置: 首页 > 专利查询>黄康专利>正文

一种基于制造技术

技术编号:39599461 阅读:9 留言:0更新日期:2023-12-03 19:59
本发明专利技术设计了一种基于

【技术实现步骤摘要】
一种基于RNN的差分隐私轨迹数据发布方法


[0001]本专利技术涉及差分隐私轨迹数据发布领域,具体涉及一种基于
RNN
的差分隐私轨迹数据发布方法

技术背景
[0002]循环神经网络
(Recurrent Neural Network,RNN),
其设计目的是处理序列数据,而用户的轨迹数据记录了用户在特定时间段内在地理空间上的移动路径和位置信息的数据

这种数据通常以时间序列形式记录,每个时间点都包含用户的位置坐标信息

用户的轨迹数据可以看成是标准的序列数据,
RNN
与传统的前馈神经网络不同,其具有循环结构,使其能够在处理序列数据时保持状态信息

通过循环结构和隐藏状态的记忆,使其能够捕捉序列中的时序信息

用于用户的轨迹数据合成中可以很好的捕捉用户轨迹中任意两个轨迹点之间的关系,对于保护合成轨迹具有良好的效果

[0003]差分隐私
(Differential Privacy

DP)
是一种隐私保护技术

用户轨迹数据在很多方面有着重要的应用,如:位置服务和导航

个性化推荐

交通规划和智能城市等

但是用户轨迹数据本身是包含着用户的许多敏感信息,因此应用用户轨迹数据必须采取适当的隐私保护措施

差分隐私技术可用于保护用户隐私,其为数据处理和分析提供了一种可靠的隐私保护框架,促进了隐私与数据应用之间的平衡,使得数据的价值能够得以充分利用

[0004]用户轨迹数据的用处之大,我们应该尽可能的在保护用户隐私的同时提高合成用户轨迹数据的可用性,使得用户轨迹数据的价值能够得以充分利用

目前,有多种轨迹数据发布方法,虽然能够很好的保护用户隐私,但用户轨迹之间的关系联系不够紧密,导致合成轨迹数据的可用性较差

为此,本专利技术提出一种基于
RNN
的差分隐私轨迹数据发布方法


技术实现思路


[0005]本专利技术目的是解决现有轨迹数据发布方法中任意一条轨迹中各个轨迹点之间关系联系不够紧密导致合成的轨迹数据可用性降低,提供了一种基于
RNN
的差分隐私轨迹数据发布方法

不仅能够对用户的隐私进行保护,还能够提升发布用户轨迹数据集的可用性

[0006]本专利技术中提出的基于
RNN
的差分隐私轨迹数据发布方法,通过学习原始轨迹数据的轨迹特征来最终合成全新的轨迹数据,具体步骤如下:
[0007]步骤一:对原始轨迹数据进行归一化,对于任意一条轨迹来说,我们只需要专注于使用关键位置样本并通过删除无关紧要的中间点来提高效率

[0008]步骤二:使用自适应网格对用户轨迹点进行离散化;轨迹数据通常是以经纬度坐标形式表示,这种数据往往是连续的,而自适应网格可以将连续的经纬度坐标映射到网格单元中,实现数据的离散化

自适应密度网格可以根据轨迹数据的分布情况,动态调整网格单元的大小,以确保在数据离散化过程中尽可能的保留原始轨迹的重要特征

[0009]步骤三:行程分布提取;轨迹的起点和终点之间的相关性在很多方面都有价值,如滴滴网约车服务

城市地铁规划

外卖服务等

我们以概率的形式来统计轨迹的起点到终点
的状态转移概率

[0010]步骤四:使用循环神经网络进行移动模型创建;用户轨迹数据集发布的最核心步骤就是能够模拟实际轨迹的移动模式,通过循环神经网络对轨迹网格中的时序信息建模,可以用于捕获轨迹的移动行为和时间依赖关系

尤其是对于具有长程依赖性的轨迹数据而言,某一轨迹点的位置不仅与前一个轨迹点有关,过去的任意轨迹点和移动行为对未来的移动预测可能都有重要影响

[0011]步骤五:路径长度计算;在获取完轨迹起点和终点之间的关系以及各个轨迹点之间的关系后,我们使用中值机制来计算每条轨迹的路径长度

对于轨迹起点
C
i
到轨迹终点
C
j
的长度,我们使用表示

[0012]步骤六:合成轨迹生成;根据上述步骤我们学习到了合成完整轨迹所需要的特征,然后我们需要根据上述特征来合成轨迹

首先生成起始和终止网格,其次计算出路径长度,然后利用移动模型来生成网格序列,最后再将轨迹网格点转换成具体的位置

附图说明
[0013]图1是基于
RNN
的差分隐私轨迹数据发布方法总体流程图
[0014]图2是自适应网格划分示例图
[0015]图3是
RNN
构建轨迹移动模型流程图
具体实施方式

[0016]为了使专利技术的技术方案更加清晰,以下结合附图来对本专利技术进一步详细说明

如图1所示,本实施例提供了一种基于
RNN
的差分隐私轨迹数据发布方法

在对原始轨迹数据进行归一化后,通过离散原始轨迹数据集到一个个网格点,在使用统计方法获取轨迹起点到终点的关系并通过
RNN
来获取任意两个轨迹点之间的关系,最后在计算轨迹长度后根据获取到的轨迹特征合成新的轨迹

[0017]轨迹数据归一化;原始轨迹数据过于繁杂,我们只需要选取那些能够代表整条轨迹的轨迹特征点

例如:对于某条轨迹
T

p1…
p9,可以使用来进行表示

其中选取特征轨迹的定义为:找到某条特征轨迹使得最小,其中
T
表示某条轨迹,表示用几个特征点表示的轨迹

[0018]自适应网格创建;设计一个自适应网格来离散化轨迹数据,将密度更大的轨迹点离散到更为精细的网格中

根据轨迹密度进行网格划分主要分为以下几个步骤:
[0019](1)
给定一个
N
×
N
的顶层网格矩阵,并将每个网格编号为
[0020](2)
对于每个网格
C
i
,发表一个查询
η
并通过添加拉普拉斯噪声来搅动正确回答,查询结果表达式如下:
[0021][0022][0023](3)
将每个网格划分成
M
×
M
更精细的网格,其中
M
的计算表达式如下:

C4的轨迹长度的计算值

[0040]与现有的轨迹数据发布算法相比,本专利技术具有的优势是使用循环本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
RNN
的差分隐私轨迹数据发布方法,其特征在于,能够有效加强任意一条轨迹中任意轨迹点之间的联系,步骤如下:步骤一:对原始轨迹数据集
D
中的任意一条轨迹
T
进行归一化操作,找到某些能够代表整条轨迹
T
的轨迹点
,
将它们组成新的轨迹步骤二:获取特征轨迹数据集以后
,
将这些轨迹离散到自适应网格中,给定一个
N
×
N
的顶层网格矩阵,每个网格依次编号为然后每个网格
C
i
再根据特征轨迹数据的密度划分为更为精细的网格;步骤三:根据统计概率的形式来获取网格起点到网格终点的状态转移概率,即轨迹起点到轨迹终点的行程分布;步骤四:使用
RNN
来训练轨迹网格数据,根据训练好的模型用于获取任意两个网格之间的状态转移概率,并生成一个状态转移概率矩阵;步骤五:使用中值机制来计算每条轨迹的轨迹长度;步骤六:根据上述步骤获取到的轨迹特征来合成最终的轨迹数据
。2.
根据权利要求1所述的基于
RNN
的差分隐私轨迹数据发布方法,其特征在于,不同网格区域的密度是不一样的,根据轨迹密度的不同,所需要划分的网格数也不同,使用
Ci
来代表某个轨迹点具体所在的网格位置
。3.
根据权利要求1所述的基于
RNN
的差分隐私轨迹数据发布方法,其特征在于,整个轨迹数据合成过程中,对于其中的核心步骤二





五的结果中都添加了拉普拉斯噪声对结果进行扰动,从而保护用户隐私,差分隐私定义可表示为如下:
Pr[A(D1)∈S]≤e
ε
Pr[A(D2)∈S]
该式表示,如果...

【专利技术属性】
技术研发人员:黄康
申请(专利权)人:黄康
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1