一种基于卷积长短期记忆网络的区域交通需求预测方法技术

技术编号:22975207 阅读:26 留言:0更新日期:2019-12-31 23:36
本发明专利技术涉及一种基于卷积长短期记忆网络的区域交通需求预测方法,属于计算机数据分析领域。本发明专利技术提出一个融合多任务的框架。对于交通流预测问题,添加多任务学习层。通过底层参数共享,同时完成多个预测目标,提高泛化能力。传统交通需求预测方法只处理单一预测任务,没有考虑到多个相关的任务能够并行的特点。本发明专利技术引入多任务学习的想法,将多个任务整合在模型的最顶层同时进行训练,代替分别训练每个任务。加入多任务层能够充分利用网络中的共享权重,提供更好的预测结果。

A regional traffic demand forecasting method based on convolution long and short term memory network

【技术实现步骤摘要】
一种基于卷积长短期记忆网络的区域交通需求预测方法
本专利技术涉及计算机数据分析领域,尤其涉及基于深度学习的获取特定时间空间信息的方法。
技术介绍
区域交通需求预测对于城市车辆管理十分重要,它能够帮助交通管理平台更好地完成车辆的空间调度,并减少乘客的等待时间。区域交通需求的预测需要考虑时间、空间及天气节假日等因素,因此具有挑战性。区域交通需求一般基于历史时间序列数据,通过数学算法预测特定位置交通需求,如利用时间序列熵计算、马尔科夫链模拟、分配平衡、泊松分布等算法。深度学习方法在区域交通需求预测领域也得到广泛应用,如使用长短期记忆网络(LSTM)进行长期需求预测,以及采用堆叠自编码器进行预测等。然而,以往的工作存在以下方面的问题:对数据中的时间或空间依赖性利用不足、没有考虑到天气,节假日等外部特征、需求变化较快时预测结果误差较大等。因此,一种能够提取数据时空特性,并融合外部特征的区域交通需求预测方法是当前待攻克的技术难关,也是本专利技术的专利技术动机。接下来详细介绍这一领域中相关的
技术介绍
。(1)时间序列预测时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。时间序列数据的变动存在着规律性与不规律性。时序变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,呈现出趋势性;并且由于外部影响,序列数值出现高峰低谷交替的周期性规律;除个别数值为随机变动外,整体序列呈统计规律。时间序列预测就是利用统计技术与方法,从预测指标的时间序列中找出演变模式,建立数学模型,对预测指标的未来发展趋势做出定量估计。自回归移动平均模型(ARMA)是时间序列预测的经典模型。自回归过程(AutoRegression)通过自身前面部分的数据与后面部分的数据之间的相关关系(自相关)来建立回归方程,从而可以进行预测或者分析。移动平均过程(MovingAverage)可以解决随机变动问题,即噪声问题。另外,深度学习方法也被应用于时间序列预测问题。循环神经网络(RecurrentNeuralNetwork)能够处理序列类型数据。长短期记忆网络(LongShortTermMemory)是一种特殊的循环神经网络,可以学习长期依赖的信息。长短期记忆网络包含一种“门”结构,能够去除或增加信息到细胞状态,以实现时序预测。根据长短期记忆网络的特点,本专利技术将引入该网络模块,根据已有的交通需求历史数据预测未来一定时段内的区域交通需求。(2)时间空间预测2014年,Huang等人提出一个两层的深度学习结构进行交通流的预测。方法中第一层是一个深度信念网络(DeepBeliefNetwork,DBN),顶部是一个多任务回归层。但该方法并没有考虑时间依赖关系。在交通预测领域,需要考虑时空依赖关系。利用不同地理位置之间的空间依赖性,能够有效提高区域交通需求预测精度。郑宇团队于2016年提出流量预测方法Deep-ST。该方法对目标区域进行网格划分。根据时间序列的趋势性、周期性及邻近性特点,分别以长期间隔数据、短时周期性数据以及邻近时刻数据作为网络输入,通过卷积神经网络获取目标区域内部空间依赖特性。该团队于2017年提出ST-ResNet,该方法在Deep-ST基础上引入残差思想,增加网络深度提升预测精度。Shi等人于2015年提出Conv-LSTM网络,将CNN与LSTM融合到一个网络结构中进行降雨量预测,其预测性能超过全连接LSTM方法。区域交通需求的预测十分具有挑战性,因为它与许多潜在信息相关。本专利技术同样基于时空预测思想进行扩展,提取时间空间依赖性,并加入外部影响因素,进一步提升模型预测性能。(3)多任务学习多任务学习是机器学习中一种非常先进的技术。其目标是利用多个学习任务中所包含的有用信息来帮助每个学习任务得到更为准确的学习器。我们假设所有任务(至少其中一部分任务)是相关的,在此基础上,我们在实验和理论上都发现,联合学习多个任务能比单独学习它们得到更好的性能。多任务学习可以看作是让机器模仿人类学习行为的一种方法,因为人类常常将一个任务的知识迁移到另一个相关的任务上。与人类学习类似,(机器)同时学习多个学习任务是很有用的,因为一个任务可以利用另一个相关任务的知识。本专利技术引入多任务学习思想,添加多任务学习层,利用网络中的共享权重提供更好的预测结果。
技术实现思路
本专利技术为了解决传统交通需求预测方法预测效率不高以及时空相关性、外部影响因素利用不充分的技术难题,设计了一个基于Conv-LSTM网络架构的交通需求预测方法,能够提取交通需求数据的时间空间依赖关系,融合天气等外部因素对交通需求的影响,并且对多个任务进行整合训练,完成对城市目标地区的交通需求预测。本专利技术的技术方案:一种基于卷积长短期记忆网络的区域交通需求预测方法,步骤如下:S1交通需求数据预处理S1.1数据筛选:交通订单数据包含上下车时间、地点及行车GPS轨迹;根据预测目标,从交通订单数据中提取上车时间及地理位置数据;S1.2数据清洗:对于提取后的数据,清洗其中的缺失值、异常值及错误纪录;S2交通需求数据时间空间划分S2.1根据预测目标,以T分钟为间隔,统计交通需求量,统计得到的数据记为X;S2.2对于需要预测的t时刻,从S2.1所统计的交通需求量数据中,分别获取其对应邻近性、周期性和趋势性数据。邻近性数据为X中的[Xt-lc,…,Xt-1],其中lc表示时间戳个数。周期性数据为X中的[Xt-lp·p,Xt-(lp-1)·p,…,Xt-p],其中lp表示时间戳个数,p表示1天。趋势性数据为X中的[Xt-ls·s,Xt-(ls-1)·s,…,Xt-s],其中ls表示时间戳个数,s表示1周;S2.3根据经纬度,将城市区位划分为I*J个网格,统计每个网格内部交通需求量;S3外部数据处理S3.1天气数据:对不同天气指标进行编码,映射为不同数值;所述的天气指标包括空气质量、天气类型;S3.2时间特性:对行车时刻所在的时间特征进行编码,映射为不同数值;所述的时间特征包括工作日、节假日;S4区域交通需求模型构建S4.1区域交通需求模型的结构区域交通需求模型包括卷积长短期记忆网络模块、外部特征模块和多任务学习模块;S4.1.1卷积长短期记忆网络模块(简称Conv-LSTM)包括三部分,每部分均由CNN与LSTM相结合得到,分别形成邻近性、周期性、趋势性通道;S4.1.2外部特征模块包括两个全连接层,用于将输入的外部特征映射到与输出相同的维度;S4.1.3多任务学习模块包括一个共享隐藏层,通过共享隐藏层,对于不同的交通需求预测任务,能够同时分别保留各任务的输出层的方式,实现多任务学习;S4.2区域交通需求模型的数据处理S4.2.1交通需求量处理:将步骤S2.2得到的邻近性、周期性、趋势性数据分别输入到卷积长短期记忆网络模块的本文档来自技高网
...

【技术保护点】
1.一种基于卷积长短期记忆网络的区域交通需求预测方法,其特征在于,步骤如下:/nS1交通需求数据预处理/nS1.1数据筛选:交通订单数据包含上下车时间、地点及行车GPS轨迹;根据预测目标,从交通订单数据中提取上车时间及地理位置数据;/nS1.2数据清洗:对于提取后的数据,清洗其中的缺失值、异常值及错误纪录;/nS2交通需求数据时间空间划分/nS2.1根据预测目标,以T分钟为间隔,统计交通需求量,统计得到的数据记为X;/nS2.2对于需要预测的t时刻,从S2.1所统计的交通需求量数据中,分别获取其对应邻近性、周期性和趋势性数据;邻近性数据为X中的[X

【技术特征摘要】
1.一种基于卷积长短期记忆网络的区域交通需求预测方法,其特征在于,步骤如下:
S1交通需求数据预处理
S1.1数据筛选:交通订单数据包含上下车时间、地点及行车GPS轨迹;根据预测目标,从交通订单数据中提取上车时间及地理位置数据;
S1.2数据清洗:对于提取后的数据,清洗其中的缺失值、异常值及错误纪录;
S2交通需求数据时间空间划分
S2.1根据预测目标,以T分钟为间隔,统计交通需求量,统计得到的数据记为X;
S2.2对于需要预测的t时刻,从S2.1所统计的交通需求量数据中,分别获取其对应邻近性、周期性和趋势性数据;邻近性数据为X中的[Xt-lc,…,Xt-1],其中lc表示时间戳个数;周期性数据为X中的[Xt-lp·p,Xt-(lp-1)·p,…,Xt-p],其中lp表示时间戳个数,p表示1天;趋势性数据为X中的[Xt-ls·s,Xt-(ls-1)·s,…,Xt-s],其中ls表示时间戳个数,s表示1周;
S2.3根据经纬度,将城市区位划分为I*J个网格,统计每个网格内部交通需求量;
S3外部数据处理
S3.1天气数据:对不同天气指标进行编码,映射为不同数值;所述的天气指标包括空气质量、天气类型;
S3.2时间特性:对行车时刻所在的时间特征进行编码,映射为不同数值;所述的时间特征包括工作日、节假日;
S4区域交通需求模型构建
S4.1区域交通需求模型的结构
区域交通需求模型包括卷积长短期记忆网络模块、外部特征模块和多任务学习模块;
S4.1.1卷积长短期记忆网络模块包括三部分,每部分均由CNN与LSTM相结合得到,分别形成邻近性、周期性、趋势性通道;
S4.1.2外部特征模块包括两个全连接层,用于将输入的外部特征映射到与输出相同的维度;
S4.1.3多任务学习模块包括一个共享隐藏层,通过共享隐藏层,对于不同的交通需求预测任务,能够同时分别保留各任务的输出层的方式,实现多任务学习;
S4.2区域交通需求模型的数据处理
S4.2.1交通需求量处理:将步骤S2.2得到的邻近性、周期性、趋势性数据分别输入到卷积长短期记忆网络模块的三个通道中;三个通道对输入输入数据的处理方式相同...

【专利技术属性】
技术研发人员:魏金泽尹宝才申彦明齐恒
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1