一种基于多任务对抗学习的稀疏轨迹用户匹配方法组成比例

技术编号：39952314 阅读：4 留言：0更新日期：2024-01-08 23:24

本发明专利技术公开了一种基于多任务对抗学习的稀疏轨迹用户匹配方法，包括：稀疏轨迹首先被输入到seq2seq模型的编码器中得到补全后的粗略位置，然后用卡尔曼滤波器来校准这些粗略位置。紧接着，完整轨迹被输入到轨迹用户匹配(TUL)的对抗性学习模型中，它包括一个编码器E、一个解码器O和一个辨别器D。E将轨迹的特征向量映射到一个共享的潜空间，O将潜空间的特征作为生成的样本投射到用户空间。E和O组成一个投影函数Φ。D从O生成的样本中区分出用户的真实实例。我们旨在学习一个理想的Φ来完成轨迹用户匹配问题。本发明专利技术提出的方法第一次研究了不完整轨迹数据的半监督TUL问题，克服了轨迹稀疏和标签少的问题，对于提升TUL任务的性能来说具有重要意义。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术给出一种基于多任务对抗学习的稀疏轨迹用户匹配方法，涉及对抗学习领域，主要用于解决轨迹用户匹配的问题，通过轨迹补全模块和对抗学习模块，可以很好地解决轨迹数据稀疏和标签不足的问题，进而用于轨迹用户匹配任务，对于提升基于位置的社交网络中的用户出行推荐任务的性能来说具有重要意义。

技术介绍

1、在城市交通管理中，由于大多数现有的方法都依赖于完整的时空数据，数据缺失问题仍然是一个挑战。不仅如此，现在人们越来越重视个人隐私。在真实的应用中如乘车共享应用 (uber、didi)会收集大量的轨迹数据，但是出于对用户隐私的保护，用户身份会被删除。但是，将轨迹与其对应的用户联系起来会有助于做出更好地个性化推荐。因此，解决轨迹用户匹配(tul)问题是一项具有挑战性的重要的任务。

2、在这样的背景下，深度学习方法能够较好地解决轨迹用户匹配问题。现在最常用的技术就是循环神经网络(recurrent neural networks，rnns)。rnn可以处理时间序列的长距离依赖问题，而轨迹中的有很多位置点是有关联的，因此rnn是现在非常热门的方法。tuler是第一个为tul提出的模型。它使用rnn对轨迹序列进行建模，以捕捉位置点之间的依赖关系。 deeptul从用户的历史轨迹中了解到用户移动的多周期性，并使用轨迹数据的空间和时间特征进行用户-轨迹匹配。考虑到大量的用户，tulsn通过链接网络对轨迹数据进行建模，只需要少量的轨迹数据来训练模型。tulvae是一个新颖的半监督变异自动编码器框架，它使用变异自动编码器来学习用户轨迹的层次语义

3、综上，现有方法通过rnn提取了轨迹数据中的各种信息如语义特征和用户移动的多周期性，但对于数据的稀疏性和无标签数据没有多做考虑，因此现有的方法仍有提升空间。

技术实现思路

1、专利技术目的：本专利技术的目的是针对现有技术的不足之处，提出一种基于多任务对抗学习的稀疏轨迹用户匹配方法，分别通过轨迹补全模块和对抗学习模块克服轨迹数据稀疏和无标签数据较多的困难。具体来说，本方法首先用卡尔曼滤波增强的seq2seq模型进行稀疏轨迹补全，然后用对抗性学习框架进行半监督的tul。

2、技术方案：一种基于多任务对抗学习的稀疏轨迹用户匹配方法，具体步骤如下：

3、步骤一：补全稀疏轨迹数据

4、1)我们根据以前的研究将坐标表示为离散的单元。然后，我们首先获得坐标的粗粒度表示，即通过seq2seq获得坐标所在的单元。最后，加入卡尔曼滤波器进行细粒度的校准，以获得准确的坐标值。具体来说，在seq2seq中，我们将输入的稀疏轨迹编码为固定矢量，并将其送入双向门控递归单元(bigru)，该单元被选作编码器。gru是长短时记忆(lstm)网络的一个变种，它能够学习连续数据的长期依赖关系而不降低性能，而bigru也能捕捉到向前和向后的时间依赖关系。gru解码器被用来恢复稀疏轨迹。与标准的seq2seq不同，在我们的模型中，对于轨迹中存在的点，即稀疏轨迹中的点，我们采用类似于nlp领域的复制思想，直接从解码器的输出槽中复制这些点我们不是直接预测缺失轨迹点的坐标值，而是预测它所在的网格单元。这种方法比直接使用坐标值更容易建模。然后，我们通过seq2seq模型预测位置点所在的单元区域，并将单元的中心作为位置点的预测坐标值。

5、2)现在我们有了对应于缺失点的单元中心，我们进一步将卡尔曼滤波器(kf)与解码器结合起来。kf本质上是线性和高斯噪声假设下的一个最佳状态估计器。它通过预测和校准两个步骤来更新由seq2seq输出产生的粗粒度预测，以获得准确的预测结果。

6、步骤二：对抗学习用于tul

7、补全后的轨迹被输入到对抗性学习模型中进行tul。我们不是逐个匹配轨迹-用户对，而是将所有用户和轨迹作为一个整体，从数据分布层面进行tul。我们的目标是学习一个投影函数φ，将用户和轨迹嵌入到一个共同的潜在空间。假设两个用户相似，则他们的轨迹也相似，反之亦然，投影φ应该使轨迹接近于在特征空间中产生它的用户。为此，tulmal使用对抗性学习框架来学习投影函数φ。具体来说，tulmal包含一个编码器e、一个解码器o和一个判别器d。编码器e将轨迹的特征向量映射到一个共享的潜空间，解码器o将潜空间的特征投射到作为生成样本的用户空间。编码器和解码器共同作为一个投影函数φ工作。鉴别器d 旨在从解码器生成的样本中区分出用户的真实实例。通过对抗性学习，判别器实质上是估计用户分布和投影轨迹分布之间的近似wasserstein距离。通过与判别器的竞争，投射函数φ将被更新以最小化估计的wasserstein距离。给定一个新的未标记的轨迹，它将首先被φ投射到用户空间，然后被链接到与之最接近的用户。

8、有益效果：本专利技术针对当前tul方法不能克服轨迹数据稀疏和无标签数据较多的困难，提出了一种基于多任务对抗学习的稀疏轨迹用户匹配方法。本专利技术采用以上技术方案与现有技术相比，具有以下技术效果：

9、1)本专利技术首次同时考虑了数据稀疏性和大量无标签数据的困难，通过一个多任务的对抗学习框架来完成tul任务。

10、2)首先通过seq2seq结合卡尔曼滤波将稀疏的轨迹数据进行补全，再将其放入对抗性学习框架中进行半监督的tul任务学习。

本文档来自技高网...

【技术保护点】

1.一种基于多任务对抗学习的稀疏轨迹用户匹配方法，其主要特征包括如下步骤：

2.根据权利要求1所述的一种基于多任务对抗学习的稀疏轨迹用户匹配方法，将稀疏轨迹进行补全后将其输入到对抗学习框架中进行轨迹用户匹配。该方法的特征在于：1)利用Seq2Seq将稀疏的轨迹数据进行补全，并通过卡尔曼滤波校准补全的轨迹数据；2)通过对抗学习框架学习用户移动的多周期性来完成轨迹用户匹配任务；3)在对抗学习框架中加入少量注释来提高模型的性能，并克服大量无标签数据的困难。

【技术特征摘要】

1.一种基于多任务对抗学习的稀疏轨迹用户匹配方法，其主要特征包括如下步骤：

2.根据权利要求1所述的一种基于多任务对抗学习的稀疏轨迹用户匹配方法，将稀疏轨迹进行补全后将其输入到对抗学习框架中进行轨迹用户匹配。该方法的特征在...

【专利技术属性】
技术研发人员：张森，王森章，
申请(专利权)人：南京航空航天大学深圳研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人