【技术实现步骤摘要】
基于时空卷积网络的网约车订单需求预测方法
[0001]本专利技术涉及智能交通技术和深度学习交叉
,具体涉及基于时空卷积 网络的网约车订单需求预测方法。
技术介绍
[0002]随着城市化的不断加快,人们对于出行的需求与日俱增,因此“打车难”的 问题日益严重,供需矛盾问题日益突出。随着网络技术的发展和智能终端的普及, 网约车通过互联网技术将车辆供给和需求连接起来,一方面有效地缓解了打车难、 司乘供给和需求之间信息不对称等问题。另一方面,网约车有效地满足了乘客的 出行需求,凭借其快速、便捷和优质的服务逐渐成为人们出行的首选方式。
[0003]由于乘客的出行需求具有波动性和随机性,网约车司机在道路上搜索乘客的 行为也有较大的盲目性,这就导致乘客需求和网约车服务之间存在较大的供需矛 盾。供需矛盾一方面导致出行乘客的候车时间较长,另一方面导致网约车司机难 以较快地搜寻乘客,使得网约车空驶时间和空驶里程增加。虽然现阶段城市网约 车的数量十分庞大,但由于网约车平台并不能根据乘客出行需求合理分布和及时 调度,城市网约车的空驶率仍 ...
【技术保护点】
【技术特征摘要】
1.基于时空卷积网络的网约车订单需求预测方法,其特征在于,包括如下步骤:S1:获取各种数据集:包括网约车平台的历史订单数据集,还有POI数据、天气数据和节假日数据这些外部数据,对获得的历史订单数据集进行预处理;S2:将经过S1预处理后的历史订单数据进行DPC聚类,将城市划分为多个虚拟站点,并定义虚拟站点网络为一个无向图;将历史订单数据集按照指定的时间间隔进行时间切片,将一个区域的上车量或下车量定义为在固定的时间间隔内在虚拟站点上车或下车的次数,并对历史订单数据集中的订单数据进行标准化处理,将处理后的数据集划分为训练集、验证集和测试集;S3:构建基于时空卷积网络的订单需求预测模型:由输入层、时间卷积模块、空间卷积模块和输出层组成;使用S2的训练集训练模型,对得到的训练后的模型利用S2的验证集进行验证,根据验证的结果选择出表现最优的预测模型;S4:使用S3得到的最优预测模型对S2的测试集进行预测,得到模型的输出结果,对输出结果进行反标准化获得预测的上车辆和下车量,取其中的上车量为最终预测出的订单需求量。2.如权利要求1所述的基于时空卷积网络的网约车订单需求预测方法,其特征在于:所述的步骤S1具体包括;S1.1:获得网约车平台的原始历史订单数据,包括用户ID、上车点经纬度、下车点经纬度、上车点时间、下车点时间、里程、费用;S1.2:基于百度公司提供的地图API,对S1.1原始历史订单数据中的上车点位置和下车点位置进行搜索,从而获得上下车点的POI特征;S1.3:在历史天气网中爬取订单所在地区的历史天气数据,包含天气特征和温度数据;S1.4:根据历史日历对历史订单数据是否属于周末和节假日进行搜索查询并标记;S1.5:对S1.1中得到的历史订单数据进行清除的预处理工作。3.如权利要求2所述的基于时空卷积网络的网约车订单需求预测方法,其特征在于:S1.5具体包括;(1)当历史订单数据存在空值或者缺失数据时,清除该订单数据;(2)当历史订单数据中的上车点位置或下车点位置超出该城市所在的经纬度范围时,认为该订单数据异常,删除该订单数据;(3)当历史订单数据中的上车点时间和下车点时间之间的时间间隔过长,超过一定的阈值后,同样认为该订单数据异常,删除该订单数据;(4)清除历史订单数据中不需要的信息,每一条订单数据只需要保留其起终点位置和时间。4.如权利要求1所述的基于时空卷积网络的网约车订单需求预测方法,其特征在于:所述的步骤S2具体包括;S2.1:将S1预处理后的历史订单数据利用密度峰值聚类方法,设定合理阈值,聚类出城市的N个虚拟站点S={s1,s2,...,s
N
},根据虚拟站点可将城市现实场景中的路网结构进行划分;S2.2:定义虚拟站点网络为一个无向图,表示为G=(V,E,A),其中V代表图的一系列节
点|V|=N,是S2.1中聚类出来的虚拟站点,E是一系列边,表示节点间的连接;A∈R
N
×
N
是图的邻接矩阵,由节点间的距离表示,计算虚拟站点之间的成对距离:其中W
ij
为虚拟站点v
i
与虚拟站点v
j
之间的边的权值,dist(v
i
,v
j
)表示从v
i
到v
j
的“路网”距离,σ为距离的标准差;S2.3:根据预设的时间间隔将历史订单数据进行时间切片分成分为T个不重叠的时间间隔,并将时间间隔定义为S2.4:使用二元组(τ,s)定义时空坐标,其中τ代表时间,s代表站点,将任意的一个对象的行程的上车和下车分别定义为:p=(τ
p
,s
p
),d=(τ
d
,s
d
),(p,d)表示上下车对,是所有的上下车对;将一个区域的上车量或下车量定义为在固定的时间间隔内在虚拟站点上车或下车的次数;给定所有的上下车对则和代表虚拟站点i在时间间隔t内的上车量和下车量:下车量:S2.5:采用Z
‑
score标准化方法,通过去除均值和按单位方差缩放来标准化上车量和下车量:x代表上车量或下车量,是x的均值,σ=std(x)是x的标准差,x
*
是经过标准化后的上车辆或下车量;S2.6:将标准化后的历史订单数据进行划分,得到训练集、验证集、测试集。5.如权利要求1所述的基于时空卷积网络的网约车订单需求预测方法,其特征在于:所述的步骤S3具体包括;S3.1:输入层将包含了邻近、日周期和周周期时间的订单需求数据与S1中得到的外部数据进行拼接,将拼接后的数据输入到时间卷积模块中捕捉时间依赖,其中邻近表示预测时刻的前几个小时,日周期表示每日相对时间间隔,周周期每周相对时间间隔;S3.2:时间卷积模块由多个时间块组成,每个时间块又由堆叠的时间卷积层组成,时间卷积层是通过门控时间卷积网络TCN实现,用于捕捉不同级别的时间信...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。