一种基于高维路网和循环神经网络的交通轨迹预测方法技术

技术编号:19123609 阅读:82 留言:0更新日期:2018-10-10 05:56
本发明专利技术请求保护一种基于高维路网和循环神经网络的交通轨迹预测方法,属于智能交通分析领域。首先,获取数据源,提取相关属性并对轨迹数据集根据车速阈值进行筛选。然后,通过近邻规则对轨迹数据进行二次筛选,获取完整的格式化轨迹数据。建立路网模型,通过时间窗口对轨迹数据集进行提取,获取目标卡口上下文关系,然后利用嵌入算法将目标卡口编码嵌入高维空间,完成二维平面路网到高位空间路网的映射,在高维空间中,卡口之间不再包含复杂的拓扑关系,使用高维相似度可以度量卡口之间在轨迹数据中的角色相似度。最后,使用双向循环神经网络对轨迹矩阵进行双向学习预测,结合前后向信息对轨迹数据进行学习预测。本发明专利技术提高了预测效率。

【技术实现步骤摘要】
一种基于高维路网和循环神经网络的交通轨迹预测方法
本专利技术属于智能交通分析领域,涉及车辆轨迹预测,尤其涉及基于用户最近时刻路径预测未来可能经过路径。
技术介绍
近年来,城市中的车辆数量急剧增多,导致城市交通遇到障碍和发展瓶颈,阻碍了城市化进程的深入。而随着传感器和互联网的发展,人们通过使用路旁视频监控设备、车载导航、GPS、智能手机等设备已经可以获得越来越多的公众出行数据。通过分析挖掘这些数据,提取城市公众出行模式,可以为用户提供个性化的出行服务,避免交通拥堵,为交通管制、城市规划提供参考依据。其中,对车辆未来轨迹的预测技术是体现公众出行模式的一个重要应用点,在一定程度上可以反应出城市交通状况和人群流动情况。城市公众出行具有非随机性和周期性,人们总是频繁出现在某些特定的地点。轨迹数据具有时空特征,一般通过对一个或多个移动对象运动过程的采样获得,包括移动对象的经纬度位置、时间、速度等信息,能反映移动对象在特定时空下的运动规律。两者相结合使城市公众移动模式提取和未来轨迹预测成为可能。当前,研究人员提出的交通轨迹预测的方法主要分为以下几种:基于个人移动模式的位置预测、基于集体移动模式的位置预测和基于外部信息的位置预测等。如Simmons等人在《LearningtoPredictDriverRouteandDestinationIntent》中通过车辆历史轨迹建立隐马尔科夫模型进行目的地和路线预测。Monreale等人在《WhereNext:alocationpredictorontrajectorypatternmining》通过构建移动模式树来匹配所有用户的历史轨迹,并以此作为预测依据。Pan等人在《Utilizingreal-worldtransportationdataforaccuratetrafficprediction》提出ARIMA+算法,通过将历史交通状况和实时轨迹相结合达到轨迹预测的目的。但以上方法中,基于欧氏距离的路网预测模型不能体现路口之间的连通关系,往往需要通过特征提取、轨迹聚类等方法提取驻足点信息才能获取统一的轨迹数据;而基于线性预测模型的轨迹预测存在零概率问题,对没有记录的轨迹效果不佳。
技术实现思路
考虑到传统路网模型的复杂性、无序性,并且无法体现卡口之间更高维关系的问题,本专利技术提出一种基于卡口上下文关系的新型路网建模算法,通过实际轨迹中的卡口上下文关系构建语料库,并使用节点间的高维相似度度量实际卡口之间的语义关联,将车辆轨迹节点映射成为高维空间向量,屏蔽实际交通路网的复杂结构。同时,使用双向循环神经网络作为预测模型,利用其良好的非线性拟合能力和能同时处理前后向信息的特点提高预测准确度。提出了一种基于高维路网和循环神经网络的交通轨迹预测方法。本专利技术的技术方案如下:一种基于高维路网和循环神经网络的交通轨迹预测方法,其包括以下步骤:通过卡口信息采集装置采集行驶中车辆原始信息,并提取车牌号、过车时间、卡口编码作为相关属性,对相关属性进行排序并按速度阈值进行初步筛选获取原始轨迹数据集;对原始轨迹数据进行二次筛选,按照近邻规则对目标卡口的相邻卡口进行筛选,选出频繁近邻卡口,去除不相关卡口之间的轨迹连接;使用固定大小的滑动窗口对二次筛选后的轨迹数据进行上下文关系提取,并建立卡口语料库,卡口语料库用于反映实际路网中卡口之间的关联关系,使用嵌入算法将这些关联关系映射到高维空间,单个卡口对应高维空间中的点,从而建立高维空间路网模型,卡口在轨迹数据中的角色相似度用卡口在高维空间中对应的点之间的距离衡量;结合道路双向性和轨迹时序性特点,使用双向循环神经网络对轨迹数据进行前向后向双向学习,得到两个输出结果后再进行加权求和得到最终预测结果。进一步的,所述提取车牌号、过车时间、卡口编码作为相关属性,对相关属性进行排序并按速度阈值进行初步筛选获取原始轨迹数据集,具体包括:卡口信息采集装置获取的属性包括:卡口编号、车牌号、过车时间、经纬度、街道名称及过车速度,选择车牌号作为轨迹划分单位,卡口编号作为轨迹点标识,过车时间作为轨迹中卡口序列排序依据。以此形成由卡口编码序列表示的轨迹数据集合。进一步的,所述对原始轨迹数据进行二次筛选,按照近邻规则对目标卡口的相邻卡口进行筛选,选出频繁近邻卡口,去除不相关卡口之间的轨迹连接,主要分为以下两个步骤:S21:对原始轨迹数据集中的卡口编号进行提取,作为轨迹卡口序列数据集;S22:对每个卡口进行近邻卡口筛选,首先对轨迹中的单个卡口pi进行相邻卡口统计,并按频次排序获得相邻卡口集合{p1,p2,p3,p4,p5},保留频次最多的三个卡口{p1,p2,p3}作为目标卡口的近邻卡口,然后去除轨迹数据中非近邻卡口之间的轨迹连接,以每条轨迹包含6个卡口的标准形成最终的轨迹数据集。进一步的,所述使用固定大小的滑动窗口对二次筛选后的轨迹数据进行上下文关系提取,并建立卡口语料库,具体包括:S31:使用固定窗口大小对目标卡口进行上下文关系提取,对于轨迹序列{p1,p2,p3,p4,p5,p6},若要对卡口p3进行上下文关系提取,使用大小为2的窗口对相邻卡口进行提取,获得p3的上下文集合{p1,p2},{p2,p4},{p4,p5},以此类推,获取各卡口上下文关系库即为卡口语料库Trajectory-Corpus。进一步的,所述使用嵌入算法将这些关联关系映射到高维空间,单个卡口对应高维空间中的点,从而建立高维空间路网模型,卡口在轨迹数据中的角色相似度用卡口在高维空间中对应的点之间的距离衡量,具体包括:S32:轨迹T中卡口pt的概率可表示为:其中n表示固定窗口的大小,Tv表示编号为v的轨迹,pt-n+j表示在时间窗口内卡口pt的相邻卡口,为了将卡口矢量化,设计目标函数:其中v表示嵌入向量,vt表示卡口pt对应的高维向量,表示轨迹T中在时间窗口内与卡口pt相邻的卡口对应向量。当输入卡口pt和pt的上下文后,迭代训练出卡口pt的高维向量vt,由此将卡口语料库中的所有卡口映射到高维空间中,最终形成高维空间路网,由以上过程可知,该高维空间路网融合了卡口上下文关系,屏蔽了二维路网的复杂结构。进一步的,所述结合道路双向性和轨迹时序性特点,使用双向循环神经网络对轨迹数据进行前向后向双向学习,主要分为以下步骤:S41:将获取的数据集按9:1的比例划分训练集和验证集,经过卡口编码被训练成为高维矢量,假设矢量维度为v,卡口总数为m,则训练集中每个样本的属性可以用5*v的矩阵表示,而标签则使用m维的one-hot编码表示;S42:构建双向循环神经网络预测模型,双向循环神经网络分为前向和后向过程,以前向过程为例,输入序列为{x1,x2,x3,x4,x5},每一步输入通过一定规则对隐含层状态h产生影响,在接受最后一步输入x5时,x5与h共同作用产生输出,后向过程为正向过程的逆序输入,通过前向过程和后向过程获得两个输出结果,两个输出结果最终通过加权求和并归一化处理获得最终输出结果。进一步的,所述通过前向过程和后向过程获得两个输出结果,两个输出结果最终通过加权求和并归一化处理获得最终输出结果,具体包括:获得前向输出结果ht和后向输出结果h’t,通过公式:其中g(·)表示激活函数SoftMax,为最终输出。选取交叉熵作为本文档来自技高网
...
一种基于高维路网和循环神经网络的交通轨迹预测方法

【技术保护点】
1.一种基于高维路网和循环神经网络的交通轨迹预测方法,其特征在于,包括以下步骤:通过卡口信息采集装置采集行驶中车辆原始信息,并提取车牌号、过车时间、卡口编码作为相关属性,对相关属性进行排序并按速度阈值进行初步筛选获取原始轨迹数据集;对原始轨迹数据进行二次筛选,按照近邻规则对目标卡口的相邻卡口进行筛选,选出频繁近邻卡口,去除不相关卡口之间的轨迹连接;使用固定大小的滑动窗口对二次筛选后的轨迹数据进行上下文关系提取,并建立卡口语料库,卡口语料库用于反映实际路网中卡口之间的关联关系,使用嵌入算法将这些关联关系映射到高维空间,单个卡口对应高维空间中的点,从而建立高维空间路网模型,卡口在轨迹数据中的角色相似度用卡口在高维空间中对应的点之间的距离衡量;结合道路双向性和轨迹时序性特点,使用双向循环神经网络对轨迹数据进行前向后向双向学习,得到两个输出结果后再进行加权求和得到最终预测结果。

【技术特征摘要】
1.一种基于高维路网和循环神经网络的交通轨迹预测方法,其特征在于,包括以下步骤:通过卡口信息采集装置采集行驶中车辆原始信息,并提取车牌号、过车时间、卡口编码作为相关属性,对相关属性进行排序并按速度阈值进行初步筛选获取原始轨迹数据集;对原始轨迹数据进行二次筛选,按照近邻规则对目标卡口的相邻卡口进行筛选,选出频繁近邻卡口,去除不相关卡口之间的轨迹连接;使用固定大小的滑动窗口对二次筛选后的轨迹数据进行上下文关系提取,并建立卡口语料库,卡口语料库用于反映实际路网中卡口之间的关联关系,使用嵌入算法将这些关联关系映射到高维空间,单个卡口对应高维空间中的点,从而建立高维空间路网模型,卡口在轨迹数据中的角色相似度用卡口在高维空间中对应的点之间的距离衡量;结合道路双向性和轨迹时序性特点,使用双向循环神经网络对轨迹数据进行前向后向双向学习,得到两个输出结果后再进行加权求和得到最终预测结果。2.根据权利要求1所述的基于高维路网和循环神经网络的交通轨迹预测方法,其特征在于,所述提取车牌号、过车时间、卡口编码作为相关属性,对相关属性进行排序并按速度阈值进行初步筛选获取原始轨迹数据集,具体包括:卡口信息采集装置获取的属性包括:卡口编号、车牌号、过车时间、经纬度、街道名称及过车速度,选择车牌号作为轨迹划分单位,卡口编号作为轨迹点标识,过车时间作为轨迹中卡口序列排序依据。以此形成由卡口编码序列表示的轨迹数据集合。3.根据权利要求1所述的基于高维路网和循环神经网络的交通轨迹预测方法,其特征在于,所述对原始轨迹数据进行二次筛选,按照近邻规则对目标卡口的相邻卡口进行筛选,选出频繁近邻卡口,去除不相关卡口之间的轨迹连接,主要分为以下两个步骤:S21:对原始轨迹数据集中的卡口编号进行提取,作为轨迹卡口序列数据集;S22:对每个卡口进行近邻卡口筛选,首先对轨迹中的单个卡口pi进行相邻卡口统计,并按频次排序获得相邻卡口集合{p1,p2,p3,p4,p5},保留频次最多的三个卡口{p1,p2,p3}作为目标卡口的近邻卡口,然后去除轨迹数据中非近邻卡口之间的轨迹连接,以每条轨迹包含6个卡口的标准形成最终的轨迹数据集。4.根据权利要求3所述的基于高维路网和循环神经网络的交通轨迹预测方法,其特征在于,所述使用固定大小的滑动窗口对二次筛选后的轨迹数据进行上下文关系提取,并建立卡口语料库,具体包括:S31:使用固定窗口大小对目标卡口进行上下文关系提取,对于轨迹序列{p1,p2,p3,p4,p5,p6},若要对卡口p3进行上下文关系提取,使用大小为2的窗口对相邻卡口...

【专利技术属性】
技术研发人员:刘宴兵朱萌钢肖云鹏朱耀堃刘浩宇程川云
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1