一种基于深度学习的网约车供需预测方法技术

技术编号:22565835 阅读:39 留言:0更新日期:2019-11-16 12:20
本发明专利技术公开了一种基于深度学习的网约车供需预测方法,首先通过网约车出行数据中订单信息、天气信息、交通拥堵信息和区域标识信息进行分析和预处理,然后分析模型结构并构建只有一个门结构的网络模型MC‑LSTM(Minimal Coupled Long Short Term Memory,简称MC‑LSTM),并利用影响网约车供需预测的数据特征设计数据集,完成网约车供需预测模型的设计。实现了对目标城市各区域未来10分钟网约车供需差额值的预测,更好的调配车辆资源。

A method of forecasting the supply and demand of network car Hailing based on deep learning

The invention discloses a method for predicting the supply and demand of car Hailing based on deep learning. Firstly, the order information, weather information, traffic congestion information and area identification information in car Hailing travel data are analyzed and preprocessed, then the model structure is analyzed and a network model MC \u2011 LSTM (minimum coupled long short term memory, referred to as MC \u2011 LSTM) with only one door structure is constructed, and The data set is designed by using the data characteristics that affect the prediction of the supply and demand of the network car hailing, and the design of the prediction model of the supply and demand of the network car Hailing is completed. It realizes the prediction of the difference between the supply and demand of the network car in the next 10 minutes in each region of the target city, and better allocates the vehicle resources.

【技术实现步骤摘要】
一种基于深度学习的网约车供需预测方法
本专利技术属于城市交通预测
,特别涉及一种基于深度学习的网约车供需预测方法。
技术介绍
目前共享经济结合前沿互联网技术的发展模式已经成为了一种新业态,国内实施的“互联网+”发展措施便是其中一种典型。在城市交通出行方面,智能交通出行公司依托先进的互联网技术构建供需服务平台,通过整合供需信息,使具有暂时性和分散性供需信息的司机乘客连接起来,双方建立共享机制,该模式也被称作网约车。网约车作为一种网络共享出租车,是出租车的一种新业态。关于出租车的供需平衡研究,很早就有学者专家进行了研究,提出了众多的经典模型算法,并且仍在对算法进行持续的优化与改进。近年来大数据技术的广泛应用为网约车供需研究带来了新的机遇,通过大数据技术分析海量的数据,进一步挖掘影响网约车供需研究的因素。目前主要的研究方向有基于特征数据提取实现预测模型的构建与改进。同时部分学者通过分析GPS数据来研究供需关系。
技术实现思路
为了克服上述现有技术的缺点,本专利技术的目的在于提供一种基于深度学习的网约车供需预测方法,通过研究深度学习网络模型及相关预测算法,分析并构建了只有一个门结构的网络模型MC-LSTM(MinimalCoupledLongShortTermMemory,简称MC-LSTM),并利用影响网约车供需预测的数据特征设计数据集,完成网约车供需预测模型的设计,实现了对目标城市各区域未来10分钟网约车供需差额值的预测,从而更好地调配车辆资源,本专利技术可以对网约车出行数据进行更加深入的挖掘,预测出来的效果更加精准。为了实现上述目的,本专利技术采用的技术方案是:一种基于深度学习的网约车供需预测方法,首先对网约车出行数据进行预处理,然后选取影响网约车供需预测的关键属性,包括温度、空气质量、交通拥堵状况、时段、供需差额和区域标识,进行特征构建,并构建基于Nadam算法的MC-LSTM模型,利用该模型进行网约车供需差额预测。所述网约车出行数据包括订单信息数据集、天气信息数据集、交通拥堵信息数据集和区域标识数据集,将城市划分为面积大小相同的若干个正方形区域,区域紧密排列在一起且互不重叠,每个区域都有自己唯一的标识码,在数据集中每个区域用哈希值标记,其中订单信息数据集主要包括网约车订单的详细信息,所述供需差额来源于此数据集;天气信息数据集主要包括各个区域各个时段的温度与PM2.5信息;交通拥堵信息数据集主要包括各个区域各个时段四个拥堵等级道路数目,等级越高表示拥堵程度越大;区域标识数据集主要包括区域标识信息。所述特征构建包括以下步骤:1)依靠时间属性结合不同时间段发生事件构建时段特征将工作日时间段分为工作日早晚高峰、工作日上班时间和工作日剩余时段,将休息日时间段分为休息日出行娱乐高峰期和休息日剩余时段;2)以天气数据集中的温度信息作为温度特征;3)以天气数据集中的PM2.5信息作为空气质量特征;4)以交通拥堵信息数据集中的交通拥堵信息作为交通拥堵状况特征;5)考虑到不同区域对供需预测的影响,用数值符号加以区分,从而形成区域标识特征;6)供需差额特征,为预测目标,简称其为Gap值。所述MC-LSTM模型是延用Coupled-LSTM模型的耦合结构,去除输出门,输出门的开关控制交由忘记门来处理,通过忘记门来激活输出状态,从输出层反向计算各层的更新门、重置门、当前记忆内容和最终记忆内容的梯度,模型运行流程如下:首先,忘记门读取t时刻输入信息与t-1时刻的输出信息,决定细胞状态信息保留与否;然后,tanh层创建新的侯选值;接下来,耦合层决定t时刻细胞状态的更新;最后,忘记门与tanh层决定网络模型的输出。所述利用Nadam算法对MC-LSTM模型进行优化的具体流程包括数据特征输入、模型训练和模型优化过程,其中:输入:总层数L,以及各隐藏层与输出层的神经元个数,激活函数和损失函数,迭代步长h,最大迭代次数MAX与停止迭代阈值j,输入的m个训练样本;输出:各隐藏层与输出层的权值W和偏置向量b;模型训练过程如下:1)初始化各隐藏层与输出层的权值W和偏置向量b的值为一个随机值;2)输入迭代次数MAX;3)输入训练样本m;4)从第一层开始逐层进行前向传播算法计算激活值;5)通过均方差损失函数计算输出层的梯度;6)从最后一层(第L层)开始逐层进行反向传播算法计算各层梯度;7)使用Nadam优化算法逐层更新权值W和偏置向量b;8)如果所有权值W和偏置向量b变化值都小于停止迭代阈值j,则跳出迭代循环到步骤9);9)输出各隐藏层与输出层的权值W和偏置向量b。所述模型优化训练过程中对Nadam算法的参数配置和调用方法如下:首先,设定Nadam算法中几个超参数alpha、beta1、beta2和epsilon的初始值,之后使用MC-LSTM模型调用编辑好的Nadam优化算法,调用过程如下所示:1)输入Nadam优化算法的学习率lr;2)计算出模型训练过程中的均方差损失函数loss,其中,m为训练样本的个数,yi为目标变量的真实值,为预测结果,二者之差称为残差;3)输出调用的Nadam优化算法。与现有技术相比,本专利技术通过基于Nadam算法的MC-LSTM优化模型对交通流数据进行训练,提取出网约车出行数据的本质特征进行预测,本专利技术所提出的模型可以实现对目标城市各区域未来10分钟网约车供需差额值的预测,从而更好地调配车辆资源。附图说明图1是本专利技术预测方法流程图。图2是本专利技术MC-LSTM模型结构示意图。图3是本专利技术利用Nadam算法对MC-LSTM模型进行优化的具体流程图。图4是本专利技术实施例中四种深度学习网络模型的实验运行结果。图5是本专利技术实施例中四类优化器的实验运行结果。具体实施方式下面结合附图和实施例详细说明本专利技术的实施方式。本专利技术一种基于深度学习的网约车供需预测方法,参考图1,步骤如下:1、通过网约车出行数据中订单信息、天气信息、交通拥堵信息和区域标识信息进行预处理;2、选取影响网约车供需预测的关键属性,包括温度、空气质量、交通拥堵状况、时段、供需差额和区域标识,进行特征构建;3、构建只有一个门结构的网络模型MC-LSTM(MinimalCoupledLongShortTermMemory,简称MC-LSTM);4、利用该模型进行网约车供需差额预测,以更好地调配车辆资源。其中,步骤1网约车出行数据包括订单信息数据集、天气信息数据集、交通拥堵信息数据集和区域标识数据集。从对网约车原始出行数据的分析来看,网约车出行数据中存在许多不符合预测分析选取规范的数据,包括数据中存在大量的缺失值、无关紧要的数据信息和数据格式错误的数据信息。网约车供需预测是一种基于时间序列的预测任务,因此需要对数据信息按本文档来自技高网...

【技术保护点】
1.一种基于深度学习的网约车供需预测方法,其特征在于,首先对网约车出行数据进行预处理,然后选取影响网约车供需预测的关键属性,包括温度、空气质量、交通拥堵状况、时段、供需差额和区域标识,进行特征构建,并构建基于Nadam算法的MC-LSTM模型,利用该模型进行网约车供需差额预测。/n

【技术特征摘要】
1.一种基于深度学习的网约车供需预测方法,其特征在于,首先对网约车出行数据进行预处理,然后选取影响网约车供需预测的关键属性,包括温度、空气质量、交通拥堵状况、时段、供需差额和区域标识,进行特征构建,并构建基于Nadam算法的MC-LSTM模型,利用该模型进行网约车供需差额预测。


2.根据权利要求1所述基于深度学习的网约车供需预测方法,其特征在于,所述网约车出行数据包括订单信息数据集、天气信息数据集、交通拥堵信息数据集和区域标识数据集,将城市划分为面积大小相同的若干个正方形区域,区域紧密排列在一起且互不重叠,每个区域都有自己唯一的标识码,在数据集中每个区域用哈希值标记,其中订单信息数据集主要包括网约车订单的详细信息,所述供需差额来源于此数据集;天气信息数据集主要包括各个区域各个时段的温度与PM2.5信息;交通拥堵信息数据集主要包括各个区域各个时段四个拥堵等级道路数目,等级越高表示拥堵程度越大;区域标识数据集主要包括区域标识信息。


3.根据权利要求2所述基于深度学习的网约车供需预测方法,其特征在于,所述特征构建包括以下步骤:
1)依靠时间属性结合不同时间段发生事件构建时段特征
将工作日时间段分为工作日早晚高峰、工作日上班时间和工作日剩余时段,将休息日时间段分为休息日出行娱乐高峰期和休息日剩余时段;
2)以天气数据集中的温度信息作为温度特征;
3)以天气数据集中的PM2.5信息作为空气质量特征;
4)以交通拥堵信息数据集中的交通拥堵信息作为交通拥堵状况特征;
5)考虑到不同区域对供需预测的影响,用数值符号加以区分,从而形成区域标识特征;
6)供需差额特征,为预测目标,简称其为Gap值。


4.根据权利要求1所述基于深度学习的网约车供需预测方法,其特征在于,所述MC-LSTM模型是延用Coupled-LSTM模型的耦合结构,去除输出门,输出门的开关控制交由忘记门来处理,通过忘记门来激活输出状态,从输出层反向计算各层的更新门、重置...

【专利技术属性】
技术研发人员:田永红郑兵吴琪张悦张鹏张晴晴
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:内蒙;15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1