【技术实现步骤摘要】
一种基于生成对抗网络的两阶段轨迹生成方法
(二)、
[0001]本专利技术涉及数据生成领域,具体讲是一种基于生成对抗网络的两阶段轨迹生成方法。
(三)、
技术介绍
[0002]轨迹数据是城市规划、交通堵塞治理、出行路线规划、旅游热点查询等领域的重要资源,通过挖掘和分析海量的轨迹数据,能够更多地了解个体和人群的移动模式,进而为人们生产和生活提供优质服务。但由于轨迹数据包含了重要的隐私信息,收集和发布轨迹数据存在泄露个人隐私的问题。这使得公开的轨迹数据较为匮乏,阻碍了轨迹数据的广泛应用。
[0003]轨迹生成是解决轨迹数据匮乏并减少个体隐私泄露的重要方法。该方法通过分析原始轨迹数据特征,设计轨迹生成模型,进而生成符合现实情况的轨迹数据。传统的轨迹生成方法通过对移动模式进行假设,手工设计轨迹模型(如马尔科夫模型)以生成轨迹数据。但由于人们移动模式较为复杂,依靠人工设计的轨迹模型生成数据,并不能较好的保持原始数据特征。近年来,研究学者提出了基于生成对抗网络(GAN)的轨迹生成方法。生成对抗网络包含两个神经网络:生成器和判别器。生成器用于学习原始轨迹数据的分布,以生成能够骗过判别器的假轨迹;判别器的目的是区分生成的假轨迹和原始轨迹。通过两者的对抗学习,生成器的学习能力和判别器的判别能力不断提高并最终达到平衡。但由于轨迹数据的高维特征,该方法在保持原始轨迹数据特征方面的表现,还有待提升。为提高生成的轨迹数据的可用性,研究学者还提出了基于条件生成对抗网络(CGAN)的方法,通过给原始轨迹数据加入一定的约束条件,以生成符合约束条 ...
【技术保护点】
【技术特征摘要】
1.一种基于生成对抗网络的两阶段轨迹生成方法,其特征在于:(1)生成轨迹初始段;从原始轨迹数据集提取每条轨迹的前n个轨迹点作为其初始段,构造训练数据集,进而设计和训练生成对抗网络,以生成轨迹初始段;假设轨迹数据集D={Tr
i
|i=0,1,
…
,|D|
‑
1}由|D|条轨迹组成,|D|表示该轨迹数据集D的轨迹数目,为轨迹数据集D的第i条轨迹,其包含t个轨迹点,为Tr
i
的第j个轨迹点,和分别为轨迹点的经度、纬度和时间戳;将Tr
i
的前m(0<m≤t)个轨迹点,即视为Tr
i
的轨迹初始段;将轨迹数据集D中所有轨迹初始段构成的集合记为D
′
={Tr
i
′
|i=0,1,
…
,|D|
‑
1},Tr
i
′
为轨迹Tr
i
的初始段,D
′
即为生成对抗网络的训练数据集;设计和训练用于生成轨迹初始段的生成对抗网络,该网络包含四个子网络,分别是编码器、解码器、生成器和判别器;编码器的训练集为轨迹初始段集合D
′
,经若干层循环神经网络(RNN)和1层全连接层,输出轨迹初始段潜码;解码器的输入为轨迹初始段潜码,经若干层RNN网络和1层全连接层,得到解码的轨迹初始段;生成器的输入为随机噪声,经若干层RNN网络和1层全连接层,生成假轨迹初始段潜码;判别器的训练集为真轨迹初始段潜码和生成器生成的假轨迹初始段潜码构成的集合,经若干层RNN网络和1层全连接层,输出轨迹初始段潜码的判别标量;生成器和判别器的整体优化目标为即给定生成器G,训练得到判别器D,要使得V(G,D)的值越大越好;给定判别器D,训练得到的生成器G,要使得V(G,D)的值越小越好;在生成轨迹初始段时,将随机噪声输入生成对抗网络的生成器,生成轨迹初始段潜码,经解码器得到轨迹初始段;(2)预测下一个轨迹点;从原始轨迹数据集D每条轨迹中提取轨迹切片和该轨迹切片后的轨迹点,构造训练数据集,进而设计和训练条件生成对抗网络,以预测下一个轨迹点;将一条轨迹中相邻的n个轨迹点称为一个长度为n的轨迹切片,记为n
‑
切片;为轨迹数据集D的第i条轨迹追加结束标识
‘
#
’
,得到新轨迹将新轨迹nTr
i
中第j(0<j≤t+2
‑
n)个n
‑
切片记为将二元组作为条件生成对抗网络的训练数据集中的一个(条件标签,轨迹点)样本;扫描轨迹数据集D的每一条轨迹,将所有二元组(条件标签,轨迹点)构成的数据集记为D
″
;设计和训练用于预测下一个轨迹点的条件生成对抗网络,该网络包含四个子网络,分别是编码器、解码器、生成器和判别器;编码器的训练集为二元组(条件标签,轨迹点)集合D
″
,经若干层RNN网络和1层全连接层,得到轨迹点潜码;
解码器的输入为轨迹点潜码和条件标签,经若干层RNN网络和1层全连接层,得到解码的轨迹点;生成器的输入为随机噪声和条件标签,经若干层RNN网络和1层全连接层,生成假轨迹点潜码;判别器的训练集为二元组(条件标签,真轨迹点潜码)和二元组(条件标签,假轨迹点潜码)构成的集合,经若干层RNN网络和1层全连接层,输出轨迹点潜码的判别标量和轨迹点潜码与条件标签的匹配分数(match score);生成器和判别器的整体优化目标为即给定生成器G
′
,训练得到判别器D
′
,要使得V
′
(G
′
,D
′
)的值越大越好;给定判别器D
′
,训练得到的生成器G
′
,要使得V
′
(G
′
,D
′
)的值越小越好;在预测下一个轨迹点时,条件标签即为步骤(1)生成的轨迹初始段,将随机噪声和条件标签输入条件生成对抗网络的生成器,生成轨迹点潜码,经解码器得到的轨迹点即为预测的下一个轨迹点;(3)将训练得到的生成对抗网络和条件生成对抗网络串联,生成完整轨迹;串联步骤(1)训练得到的生成对抗网络和步骤(2)训练得到的条件生成对抗网络,生成轨迹数据集2.根据权利要求1所述的一种基于生成对抗网络的两阶段轨迹生成方法,其特征在于:设计和训练用于生成轨迹初始段的生成对抗网络,该网络包含四个子网络,分别是编码器、解码器、生成器和判别器,解码器依据下式,计算重构损失Loss
res
,其中,T表示原始轨迹初始段,En表示编码器,En(T)表示轨迹初始段T经过编码器得到的潜码,De表示解码器,De(En(T))表示轨迹初始段T的潜码En(T)经过解码器得到的轨迹初始段,‖T
‑
De(En(T))‖2表示原始轨迹初始段T与解码得到的轨迹初始段De(En(T))的第二范式距离,P
T
(T)表示轨迹初始段数据分布,T~P
T
(T)表示T为从分布P
T
(T)中采样得到的一个轨迹初始段,轨迹初始段,表示T服从分布P
T
(T)时‖T
‑
De(En(T))‖2的期望。依据重构损失Loss
res
,利用梯度下降方法,更新编码器、解码器的参数,使得后续训练得到的重构损失Loss
res
的值尽量小。3.根据权利要求1所述的一种基于生成对抗网络的两阶段轨迹生成方法,其特征在于:设计和训练用于生成轨迹初始段的生成对抗网络,该网络包含四个子网络,分别是编码器、解码器、生成器和判别器,生成器的损失函数Loss
G
为其中,z为随机噪声,P
z
(z)表示随机噪声数据分布,z~P
z
(z)表示z为从分布P
z
(z)中采样得到的随机噪声,G(z)为生成器以随机噪声z为输入而生成得到的假轨迹初始段潜码,D(G(z))为判别器对假轨迹初始段潜码G(z)输出的判别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。