一种基于对抗自编码器的交通大数据修复方法技术

技术编号:26973348 阅读:42 留言:0更新日期:2021-01-06 00:06
本发明专利技术公开了一种基于对抗自编码器的交通大数据修复方法,包括:确定需要进行交通数据修复的路段,采集该路段的历史交通数据;基于历史交通数据,构建掩码矩阵;构建对抗神经网络,包括:构建结合注意力机制的自编码器模型作为生成器,结合注意力机制构建判别器;基于历史交通数据和掩码矩阵,训练对抗神经网络,生成数据修复模型;利用数据修复模型修复所述路段实时采集的交通数据。本发明专利技术在GAN的基础上引入自编码器、多头注意力机制,以及线索矩阵等结构,利用对抗神经网络的结构有效地学习交通大数据的分布特征,并利用自编码器依据存在缺失的交通数据生成完整的交通数据,且通过多头注意力机制和线索矩阵可以有效提高模型数据修复的准确性。

【技术实现步骤摘要】
一种基于对抗自编码器的交通大数据修复方法
本专利技术涉及交通数据修复
,特别涉及一种基于对抗自编码器的交通大数据修复方法。
技术介绍
在许多实际的交通分析模型部署时,涉及对多传感器采集的、带有空间分布标记的时间序列数据进行分析。例如气温传感器采集的带地理标签的气温数据、空气污染物监测数据、道路交通传感器采集的交通数据等。由于传感器故障、通信出错、存储丢失等原因,传感器采集的数据难免存在数据丢失问题。例如数据的分类、回归预测和交通控制优化等任务。由于数据缺失模式的多样性,修复数据工作是很具有挑战性的任务,需要设计合适的算法从多维的数据提取数据的变化规律,尤其是找出数据间的相互依赖关系。传统的数据修复方法往往具有各自的局限,例如基于统计分析利用平均数、众数、中位数等方法的数据修复方法往往忽略数据中的相互依赖关系;基于统计机器学习模型对数据施加比较强的约束,比如线性的假设、数据的平滑性等。A.V.Dalca等人提出了一种基于卷积神经网络(ConvolutionalNeuralNetwork,CNN)和稀疏感知的变分逼近学习算法。本文档来自技高网...

【技术保护点】
1.一种基于对抗自编码器的交通大数据修复方法,其特征在于,所述方法包括以下步骤:/n步骤1,确定需要进行交通数据修复的路段,采集该路段的历史交通数据;/n步骤2,基于所述历史交通数据,构建掩码矩阵;/n步骤3,构建对抗神经网络,包括:构建结合注意力机制的自编码器模型作为生成器,结合注意力机制构建判别器;/n步骤4,基于所述历史交通数据和掩码矩阵,训练所述对抗神经网络,生成数据修复模型;/n步骤5,利用所述数据修复模型修复所述路段实时采集的交通数据。/n

【技术特征摘要】
1.一种基于对抗自编码器的交通大数据修复方法,其特征在于,所述方法包括以下步骤:
步骤1,确定需要进行交通数据修复的路段,采集该路段的历史交通数据;
步骤2,基于所述历史交通数据,构建掩码矩阵;
步骤3,构建对抗神经网络,包括:构建结合注意力机制的自编码器模型作为生成器,结合注意力机制构建判别器;
步骤4,基于所述历史交通数据和掩码矩阵,训练所述对抗神经网络,生成数据修复模型;
步骤5,利用所述数据修复模型修复所述路段实时采集的交通数据。


2.根据权利要求1所述的基于对抗自编码器的交通大数据修复方法,其特征在于,步骤1中所述历史交通数据包括道路流量、速度和占有率。


3.根据权利要求1或2所述的基于对抗自编码器的交通大数据修复方法,其特征在于,步骤2所述基于所述历史交通数据,构建掩码矩阵,具体过程包括:
步骤2-1,构建交通数据矩阵,该矩阵第i行第j列的数据表示第j个交通数据采集装置在第i个时间点或时间段采集的历史交通数据;
步骤2-2,构建掩码矩阵,该矩阵与所述交通数据矩阵维度相同,若交通数据矩阵中某个位置缺失数据,掩码矩阵中的对应位置设为0,否则设为1。


4.根据权利要求3所述的基于对抗自编码器的交通大数据修复方法,其特征在于,步骤3中所述生成器包括依次设置的位置编码模块,以及依次设置的N组第一模块,该第一模块包括依次相连的多头注意力结构、全连接神经网络;N≥1;多头注意力结构的输入和输出相加后输入全连接神经网络;
所述位置编码模块,使用不同频率的正弦和余弦函数的采样值作为位置编码的信息:






式中,pos为输入数据的位置,i表示维度,dmodel表示输入的时间维度长度;PE(pos...

【专利技术属性】
技术研发人员:张伟斌张蒲璘余英豪
申请(专利权)人:南京理工大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1