基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置制造方法及图纸

技术编号:13889102 阅读:190 留言:0更新日期:2016-10-24 03:35
本发明专利技术公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置,该方法包括:步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;步骤3:对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。本发明专利技术能提供一种用地图瓦片代替传统的基于纯经纬度轨迹的预测方法,从而能够对经纬度引入的误差在一定程度上进行避免,并且可根据实际预测地理范围精度进行瓦片级别的设定。利用LSTM循环神经网络使得模型具有某种记忆性,能够记住之前已发生的情况。该方法和装置能够提供一种科学的用户轨迹预测的新思路。

【技术实现步骤摘要】

本专利技术涉及轨迹预测领域,尤其涉及一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法和装置
技术介绍
随着移动终端的多样化和移动应用的不断普及,越来越多的人群使用智能终端进行定位和导航。在此背景下,相关的定位服务厂商积累了越来越多的用户定位数据,同时电信运营商也采用蜂窝技术进行定位,但对于用户轨迹的预测研究甚少。用户轨迹预测即已知用户某时点之前的轨迹位置序列,预测该时点之后位置信息。地图瓦片是web地图中常用的坐标缩放技术,本质上是一种坐标系统。不同级别的瓦片对应不同的缩放级别。如(0,0,0)表示级别为0的瓦片坐标,该瓦片覆盖整个世界范围。当缩放级别为1时,把缩放级别为0时的那张瓦片分割成四个相等的方块,其中坐标为(0,0,1)和(0,1,1)的两块覆盖北半球,坐标为(1,0,1)和(1,1,1)的两块覆盖南半球。瓦片坐标与地理真实坐标一般采用墨卡托投影进行转换。该投影是正轴等角圆柱投影,投影后的经线是均匀分布,纬线从赤道向南北极越来越稀疏。不同地图厂商的瓦片坐标区别只是从墨卡托坐标到瓦片坐标的转换方式不同,不失一般性,以Google地图瓦片坐标为例,Google瓦片的(0,0)坐标始终位于西经180°,北纬85.0511°。从该坐标向东,向南,横纵坐标值均变大。记(x,y,w)为瓦片坐标,x为横坐标,y为纵坐标,w为瓦片级别。经纬度与瓦片的转换公式如下:其中lat,lon分别代表纬度、经度。LSTM是一种时间递归神经网络,由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件。目前关于用户轨迹预测的出发点大都是直接从经纬度或者移动基站的位置出发,利用相关概率模型进行用户的轨迹预测,这些方法存在两个问题,一是定位本身就存在定位精度的问题,GPS定位精度较高,基本在10米以内。基站定位精度较差,一般为100-1000米的定位精度。定位本身的误差使得模型的计算本身就是基于偏差样本进行,因此预测的效果也会大打折扣。二是模型本身,概率模型没有过多的考虑轨迹的连续性问题,某时刻的轨迹不仅仅与上一时刻的位置有关,还与整体的移动方向有关,如一个正在上班路上的上班族不太可能在某个时点之后向其上班路线的反方向移动。即模型要具有某种记忆性,能够记住之前已发生的情况。
技术实现思路
本专利技术的目的旨在提出一种在一定程度上解决上述问题的方法。为了解决上述问题,本专利技术提供了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法。一方面采用瓦片技术使得定位精度在某个瓦片级别上变得不重要(总能找到一个瓦片级别覆盖其精度范围),也就是说某时刻的经纬度位置转换为瓦片位置。从而使得原先在经纬度级别上存在的精度误差,在瓦片级别上得以部分消失(如果实际位置与记录位置不在同一级别的某个瓦片上,则误差依然存在)。并且随着瓦片级别的缩小,实际位置与记录位置在同一瓦片的可能性越来越大。比较极端情况下,实际位置和记录位置在一个城市。因此可根据实际的预测精度需要选择合适的瓦片级别。另一方面采用LSTM循环神经网络模型,可利用该模型针对时间序列有某种程度的“记忆性”,使得能够较好的记住之前用户发生的轨迹情况,避免得出与实际情况相悖事件发生的可能性。本专利技术解决其技术问题所采用的技术方案为实现上述目的,本专利技术公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法,该方法包括:步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。进一步的,所述步骤1包括:步骤11,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;步骤12,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。进一步的,所述步骤12包括:步骤121,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;步骤122,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;步骤123,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。进一步的,所述步骤2包括:步骤21,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;步骤22,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;步骤23,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本专利技术采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。进一步的,所述步骤3包括:步骤31,已知发生的经纬度轨迹序列,根据步骤11、步骤121,步骤122三个步骤,求得已发生的瓦片轨迹序列:<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;步骤32,利用已发生的瓦片轨迹序列,和步骤2中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。为实现上述目的,本专利技术还公开了一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置,该装置包括:预处理模块,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;建模模块,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;预测模块,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可本文档来自技高网
...

【技术保护点】
一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,包括:步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。

【技术特征摘要】
1.一种基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,包括:步骤1,对用户的所有的经纬度轨迹进行瓦片序列化,形式训练数据集;步骤2,利用LSTM循环神经网络对训练数据集进行训练,得到LSTM模型;步骤3,对该用户已知的经纬度发生轨迹,利用LSTM模型计算出各种可能瓦片的概率,取概率最大者,即为该用户的预测瓦片。2.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤1包括:步骤11,对用户的所有经纬度轨迹进行瓦片化转换,使其转换为瓦片轨迹。记用户轨迹为<UID,T,Lon,Lat>,其中UID为用户ID,T为时间(精确到秒),Lon为经度,Lat为纬度。利用经纬度与瓦片的转换公式,得到用户的瓦片轨迹,记为<UID,T,(X,Y,W)>,其中X,Y为横纵坐标,W为瓦片级别。W根据需要事先设定;步骤12,对用户的所有瓦片轨迹进行等时间段离散化,根据事先选定步长,进行已发生瓦片序列集与预测瓦片集的切分,形成训练数据集。3.如权利要求2所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤12包括:步骤121,选定时间段M分钟,从0点到24点依次等时间段分割,记为<UID,D,P,(X,Y,W)>;D为日期,P为整数;步骤122,汇总求和每天每时间段P,<X,Y,W>对应的出现频次,取频次最高的瓦片为该时间段用户的驻留瓦片,记为<UID,D,P,(X,Y,W)>;步骤123,设定步长L,从用户驻留瓦片集中,从第一个时间段1到时间段N,依次取长度为L的连续序列,记为:<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,i=0,1,…N-L-1,组成已发生瓦片序列集,瓦片<UID,D,i+L+1,(X,Y,W)>为对应已发生瓦片序列对应的预测瓦片,即i+L+1时段对应的瓦片,已发生瓦片序列则为i+L+1时段之前的发生瓦片序列。因此[<UID,D,i+L+1,(X,Y,W)>],i=0,1,…N-L-1,为预测瓦片集,已发生瓦片序列集和预测瓦片序列集组成训练数据集。4.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤2包括:步骤21,设定LSTM循环神经网络模型的第一层输入维度<L,K>,其中K为该用户在训练集中出现的不重复瓦片个数,该模型第一层为LSTM单元;步骤22,设定LSTM循环神经网络模型的最后一层输出维度K。该模型的最后一层为标准的一维全连接层,记为Dense(K),为了归一化概率引入多分类的softmax函数层;步骤23,在第一层LSTM单元与最后一层一维全连接层中间加入多层LSTM单元。具体的层数和LSTM节点数可通过实验的方式设定(不失一般性,为了减少网络参数和降低模型复杂度,本发明采用1层LSTM单元作为中间层。),设定好LSTM循环神经网络的结构和参数后,结合训练数据集进行模型的训练,得到LSTM循环神经网络模型。5.如权利要求1所述的基于地图瓦片和LSTM循环神经网络的轨迹预测方法,其特征在于,所述步骤3中:步骤31,已知发生的经纬度轨迹序列,根据步骤11、步骤121、步骤122三个步骤,求得已发生的瓦片轨迹序列:<UID,D,i+1,(X,Y,W)>,<UID,D,i+2,(X,Y,W)>,…<UID,D,i+L,(X,Y,W)>,其中0=<i<=N-L-1,i为整数;步骤32,利用已发生的瓦片轨迹序列,和步骤2中所得到的LSTM循环神经网络模型,计算出所有K个瓦片的发生概率,取最大的概率对应的瓦片即为该发生序列第i+L+1时段对应的瓦片。6.一种基于地图瓦片和LSTM循环神经网络的轨迹预测装置,其特征在于,...

【专利技术属性】
技术研发人员:邢曙光
申请(专利权)人:河南明晰信息科技有限公司
类型:发明
国别省市:河南;41

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1