一种基于生成对抗网络的缺失交通状态数据填补方法技术

技术编号：39933682 阅读：9 留言：0更新日期：2024-01-08 22:01

本发明专利技术提供一种基于生成对抗网络的缺失交通状态数据填补方法，首先构建检测路网的邻接表，使用node2vec图嵌入算法对邻接表中的节点进行带有偏重的随机游走，得到邻接道路交通状态矩阵。对邻接道路交通状态数据矩阵采用最大最小标准化算法进行数据归一化，构建生成对抗网络模型，并确定生成器与判别器的模型结构。对生成对抗网络中的生成器与判别器的损失函数进行定义，使用滑动窗口法，对邻接道路交通状态数据进行选择，将其作为生成对抗网络模型的输入，通过对抗训练最小化生成数据与真实数据分布之间的差异，生成缺失路段的道路交通状态。本发明专利技术方法很好地结合了交通数据的特点，提高了数据填补的效率，相较于传统方法有更好的泛化性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于交通数据处理领域，具体涉及一种基于生成对抗网络的缺失交通状态数据填补方法。

技术介绍

1、缺失交通状态数据填补是指在交通数据集中存在一些缺失值的情况下，通过一系列的方法和技术来预测和填充这些缺失值，从而完整地恢复数据集。随着人工智能的快速发展和广泛应用于智能交通领域，例如交通流量预测和拥堵预测，准确的道路交通状态数据变得至关重要，这是实现智能交通系统对交通状态进行精准预测的前提条件。然而，正常情况下所得到的交通数据是稀疏、含有较多缺失值的，不能准确的反映交通的全部情况，缺失交通状态数据填补工作在这其中变得尤其重要。

2、目前，关于交通状态数据的恢复算法主要有插值法、均值填补法、回归模型以及时间序列方法等，这些方法都是基于统计学在交通领域的应用，并不能很好的考虑到交通数据的时空特征。ge-gan模型中利用了deep walk对图结构进行了图嵌入处理，但是随机性较高，没有充分利用图结构信息。

技术实现思路

1、为解决上述问题，本专利技术公开了一种基于生成对抗网络的缺失交通状态数据填补方法，利用缺失路段周围交通状态数据，通过node2vec方法对邻接表中的节点进行带有偏重的随机游走，充分学习其数据分布等特征，使用成对抗网络来生成缺失路段的数据，极大地利用了交通数据时空特征。

2、为达到上述目的，本专利技术的技术方案如下：

3、一种基于生成对抗网络的缺失交通状态数据填补方法，具体步骤如下：

4、步骤s1：利用图嵌入算法，根据检测

5、根据各个路段的位置和邻接关系，构建路网的邻接表，使用图嵌入算法中的node2vec方法学习节点的低维嵌入表示，继而得到路网的交通状态矩阵，具体如下：

6、子步骤s11：构建路网邻接表

7、首先构建路网的结构网络g＝(v，e)，其中e＝{v1，v2，v3，...，vn}，n＝|v|，vi代表第i个路段，代表路网中的一个节点，e则为路段的邻接矩阵，若第i个路段与第j个路段相邻，则eij＝1，反之eij＝0；

8、然后创建一个空的邻接表数据结构，用于存储图g的拓扑结构，遍历g的所有边，对于每条边，获取起点和终点节点的编号，检查邻接表中是否已存在起点节点，若不存在，则创建一个空的邻接列表，并将其与起点节点关联，将终点节点添加到起点节点的邻接列表中表示它们之间的连接，直到遍历完所有的边；

9、子步骤s12：对邻接表中的节点进行带有偏重的随机游走

10、给定当前顶点v访问下一个顶点x的概率为：

11、

12、πvx是顶点v和顶点x之间的未归一化转移概率，z是归一化常数；

13、引入两个超参数广度优先采样参数p和深度优先采样参数q来控制随机游走的策略，假设当前随机游走经过边(t，v)到达顶点v，设πvx＝αpq(t，x)·wvx，wvx是顶点v和x之间的边权，

14、

15、dtx为顶点v和x之间的最短路径距离；

16、选择节点vi作为起始点，对该节点进行p(ci＝x|ci-1＝v)的概率选择下一个访问的节点，并通过p，q调整节点游走的概率，即通过一种有概率偏重的随机游走策略得到节点的游走序列其中代表第j次随机游走选择的节点，并且只能从的相邻节点中选择，对g中的每个节点均进行带概率偏重的随机游走，随机游走序列的长度为k，并且每个节点游走重复的次数为η，最终得到序列矩阵其中h维度为n·η×k；

17、子步骤s13：使用skip-gram获取网络节点低维嵌入向量

18、选取网络中节点vi∈v，计算其余节点在ψ(vi)中出现的概率，优化函数表示为：

19、

20、

21、

22、

23、其中，ψ∈ed为映射函数，d为低维节点嵌入向量维度的大小，w为滑动窗口的大小，f＝(f0，f1，f2...f|log|v||)为将网络中所有节点作为二叉树的叶节点构建的二叉树，从根节点ψ(vi)到网络中的节点vj的唯一的路径表示，并且f0＝ψ(vi)，f|log|v||＝vj，ψ(fr)是fr父节点的表示向量；

24、最终获取ψ(vi)中概率最大的l个节点的交通状态数据x＝[x1，x2，...xl]；

25、步骤s2：对获取到的邻接道路交通状态矩阵进行预处理，建立生成对抗网络模型

26、对获取到的邻接道路交通状态矩阵进行最大最小标准归一化操作，确定生成对抗网路模型的生成器与判别器结构，具体如下：

27、子步骤s21：对邻接道路交通状态矩阵进行最大最小归一化操作

28、

29、其中，为第i个节点在第t时刻的交通状态，min(xi)，max(xi)分别表示第i个节点交通状态数据的最小值与最大值，为归一化后的交通状态数据，标准化操作后得到交通状态数据矩阵

30、子步骤s22：生成对抗网络模型的构建

31、选取邻接道路交通状态数据其中r为选取数据的滑动窗口大小，构建包含3层隐藏层的生成器g，三个隐藏层的输出维度分别为512，256，128，隐藏层后为sigmoid激活函数，构建包含3层隐藏层的判别器d，3个隐藏层的输出维度分别为512，256，128，隐藏层后为sigmoid激活函数，将wt作为生成器的输入数据，判别器的输入数据来源于生成器的输出与真实交通状态数据。

32、步骤s3：给定生成对抗网络的损失函数，训练得出缺失道路的交通状态数据

33、定义生成对抗网络中的生成器与判别器的损失函数，邻接道路交通状态数据使用滑动窗口法进行数据的输入，通过对抗训练，以最小化生成数据与真实数据分布为目标函数，最终训练出效果最好的缺失道路交通状态数据，具体如下：

34、lg＝-d(g(wt))+a·lcons

35、

36、

37、其中，lg为生成器损失函数，ld判别器损失函数，lres为生成器生成数据与真实数据的平均绝对值误差，分别为在第a时刻的生成数据与真实数据，α为重构误差参数，为真实数据；

38、定义模型优化器，生成器接收滑动窗口下的邻接交通状态数据作为输入，并生成假数据。判别器将生成器的输出以及真实数据作为输入，并试图判断它们是来自生成器还是真实数据。通过这种对抗性的训练方式，生成器的目标是生成尽可能逼真的数据，而判别器的目标则是准确区分生成器生成的数据和真实数据，模型不断训练，通过这样的对抗训练过程，生成对抗网络能够不断优化生成器和判别器，使生成的数据尽可能接近真实数据。

39、本专利技术的有益效果为：

40、本专利技术使用node2vec图嵌入算法学习节点的低维嵌入表示，兼顾了深度优先和广度优先，可以全面地学习到图的特征；利用了周围路段的交通状态数据对确实路段数据进行填补，很好地利用了交通数据的特征。

本文档来自技高网...

【技术保护点】

1.一种基于生成对抗网络的缺失交通状态数据填补方法，其特征在于，具体步骤如下：

【技术特征摘要】

1.一种基于生成对抗网络的缺失交通状态数...

【专利技术属性】
技术研发人员：李旭，左锦鹏，石天京，杨仕淮，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人