当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于多任务学习的交通大数据分析与预测系统及方法技术方案

技术编号:30316384 阅读:45 留言:0更新日期:2021-10-09 23:11
本发明专利技术公开了一种基于多任务学习的交通大数据分析与预测系统及方法,该系统包括数据采集终端、大数据分析和预测平台以及用户终端。数据采集终端包括数据采集模块和数据传输模块;大数据分析和预测平台包括预处理模块、交通大数据时空建模模块和多任务学习预测模块。用户终端包括数据接收模块和用户匹配模块。本发明专利技术采集的车载GPS数据和轨迹数据进行分析和建模,预测未来时间段内的交通大数据走向和趋势,从而为用户提供出行建议,减少用户的行程等待时间。本发明专利技术先提高了交通大数据的预测精确度,能提前预知用户出行的速度和出发时间,以方便出行者合理安排出发时间,最大限度地避开高峰出行或前往目的地,方便用户提前制定应对方案。制定应对方案。制定应对方案。

【技术实现步骤摘要】
一种基于多任务学习的交通大数据分析与预测系统及方法


[0001]本专利技术主要涉及交通大数据领域,具体涉及一种基于多任务学习的交通大数据分析与预 测系统。

技术介绍

[0002]随着城市的机动车数量日益增长,城市的交通受到了巨大的挑战。拥堵成为城市交通的 代名词,交通事故的数量也不可小觑。但是,随着大数据等技术的极速发展,大量的交通大 数据被采集和研究。交通大数据作为促进交通发展的重要组成部分,其具有数据量庞大、数 据类型多、实时性高等特征,应用大数据相关深度学习理论分析与挖掘交通大数据的特征和 趋势将会有利于改善城市交通的拥堵现状,这不仅能解决用户层面上的“出行难”问题,也 能为交通管理部门提供决策帮助。
[0003]近些年来,如何分析和挖掘交通大数据的深度特征并对其进行建模和预测,已逐渐成为 城市计算领域的一大热点,并受到许多国内外专家及公司的关注。现有的工作主要通过挖掘 单个预测任务如交通流、速度、行程时间等的内部时空关联,通过引入深度学习方法对交通 数据进行建模,并预测交通数据。这些工作都忽略了不同预测任务之间的时空关联和任务依本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多任务学习的交通大数据分析与预测系统,其特征在于,包括数据采集终端、大数据分析和预测平台、用户终端:所述数据采集终端包括车载数据采集模块和数据传输模块。所述车载数据采集模块采集机动车的车载GPS数据和轨迹数据,并将采集到的车载GPS数据和轨迹数据都传输到数据传输模块。所述数据传输模块即将车载数据采集模块采集到的车载GPS数据和轨迹数据传输到数据预处理模块。所述大数据和预测平台包括数据预处理模块、交通大数据时空建模模块和多任务学习预测交通大数据模块;所述大数据和预测平台主要是基于多任务学习捕捉多个任务间的相关性并对任务进行预测;所述数据预处理模块先接收数据传输模块所传输的车载GPS数据和轨迹数据,然后基于接收的车载GPS数据提取出各段行程的速度和行程时间,生成完整的行程记录,得到数据预处理后的交通大数据;所述数据预处理模块基于完整的行程记录,利用时空聚类算法提取城市热区,并根据热区间的连接关系构建城市热区空间网络;所述交通大数据时空建模模块利用深度时空数据建模方法对预处理后的交通大数据进行时空特征提取,为大数据预测平台打下基础;所述多任务学习预测模块利用多任务学习等深度学习方法对预处理后的交通大数据进行多个任务同时预测,基于历史交通大数据预测未来时间段内的交通数据;所述用户终端包括预测结果接收模块和用户匹配模块。所述预测结果接收模块接收大数据和预测平台输出的预测交通数据,并传输给用户匹配模块。所述用户匹配模块将得到的预测交通数据与个人用户进行匹配,将匹配结果输出到个人用户端。2.根据权利要求1所述的基于多任务学习的交通大数据分析与预测系统,其特征在于,所述车载数据采集模块采集到的车辆GPS数据包括车辆脱敏后的id、车辆某段行程开始时间和结束字段、相应出发位置和到达位置的经纬度字段;所述车载数据采集模块采集到的轨迹数据包括车辆脱敏后的id、车辆每隔一段固定时间的地理位置的经纬度字段、当前的时间戳和车辆的详细行程轨迹。3.根据权利要求1所述的基于多任务学习的交通大数据分析与预测系统,其特征在于,所述数据预处理模块处理得到的行程记录包括车辆脱敏后的id、行程的开始时间、行程开始位置、行程中每隔30s的采样轨迹点对应的点时间和点位置、行程结束时间、行程结束位置到达位置经纬度、平均速度和行程时间。4.一种应用权利要求1所述系统的交通大数据分析与预测方法,其特征在于,包括如下步骤:(1)利用数据采集终端,采用移动采集设备采集车辆的车载GPS数据和轨迹数据,然后将采集的车载GPS数据和轨迹数据传输到大数据分析和预测平台;(2)在大数据分析和预测平台中,先利用数据预处理模块进行预处理操作,对采集的车载GPS数据和轨迹数据进行每一条轨迹的行程时间和行程速度的计算,得到交通大数据。(3)在大数据分析和预测平台中,进行交通大数据时空建模操作。先根据处理后的车辆行程数据,实施基于时空聚类算法的城市热区提取,获取不同时间段内相应的城市热区及热区之间的连接关系,构建图的邻接矩阵。其次获取不同时间段内通过每个热区所需的时间,和通过每个热区的不同时间段内的平均出发时间,构建基于平均出发时间和城市热区
的二维矩阵X
d
和基于平均速度和城市热区的二维矩阵X
c
,即图的特征矩阵。然后基于邻接矩阵和特征矩阵构建基于平均出发时间的图G
d
和基于平均速度的图G
c
,将图G
d
和图G
c
输入到图卷积神经网络中进行训练,提取空间特征。最后将所述空间特征的时间序列输入到门控循环单元GRU中,通过单元之间的信息传递获得时间上的动态特征。(4)在大数据分析和预测平台中,利用多任务学习预测模块预测步骤(2)得到交通大数据,将步骤(3)提取的空间特征和时间特征输入到多任务学习神经网络中,通过多任务学习神经网络挖掘任务间的潜在的相关性,从而在任务中发挥作用,使每个单独的任务受益,最终多任务学习模型输出未来每个热区不同时间段内的行程速度和平均出发时间。(5)通过用户终端,基于预测所得未来时间段的各个热区所对应的平均出发时间和平均速度,匹配个人用户轨迹,对经过热区的用户进行出发时间的推荐和建议。5.根据权利要求4所述的交通大数据分析与预测方法,其特征在于,所述步骤(2)包括以下子步骤:(2.1)计算每一段GPS行程的平均速度和行程时间,并作为特征添加进对应GPS行程表。(2.2)利用步骤(2.1)采集的GPS行程表,并根据每一段GPS行程的车辆id、出发时间、到达时间,与轨迹行程进行匹配,还原一段完整的行程记录。t=StopTime

StartTime其中t为行程的总时间,StopTime为行程的结束时间,StartTime为行程的开始时间,distance(P,Q)为行程起点P(StartLon,StartLat)和行程终点Q(StopLon,StopLat)之间的距离,计算公式为:distance(P,Q)=Euclidean(StartLon,StopLon,StartLat,StopLat)其中,StartLon为行程的起点经度,StartLat为行程的起点纬度,StopLon为行程的终点经度,StopLat为行程的终点纬度。其次对采集的轨迹行程数据进行数据清洗,筛选出了行程时间大于五分钟的行程。匹配GPS数据和轨迹数据后,生成完整的行程记录。(2.3)基于步骤(2.2)生成的完整的行程记录,采用时空聚类算法对行程记录聚类,提取出城市中不同时间段的热区分布,并构建相应的热区矩阵。在时空聚类算法中,聚类参数EPS1和EPS2如下:EPS1=Euclidean(Lon1,Lat1,Lon2,Lat2),其中,Lon1、Lat1、t1分别为行程中某点P的经度、纬...

【专利技术属性】
技术研发人员:陈红阳许申缘肖竹
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1