当前位置: 首页 > 专利查询>云南大学专利>正文

基于密度的停留点识别方法技术

技术编号:19342504 阅读:20 留言:0更新日期:2018-11-07 14:01
本发明专利技术公开了一种基于密度的停留点识别方法,包括以下步骤:步骤一:密度计算;步骤二:停留点识别。本发明专利技术考虑轨迹点的时间连续性和方向性,符合停留点的时空语义,考虑轨迹点的密度,反映停留点在时间和空间上的聚集,以及轨迹点的重要性和区分性,为GPS轨迹中的停留点识别提供了一种兼顾轨迹点的时间连续性和方向性以及密度的方法。

Density based stopping point identification method

The invention discloses a density-based residence point identification method, which comprises the following steps: step 1: density calculation; step 2: residence point identification. The invention considers the time continuity and direction of the trajectory points, conforms to the space-time semantics of the trajectory points, considers the density of the trajectory points, reflects the aggregation of the trajectory points in time and space, and the importance and distinction of the trajectory points, thus providing a kind of time continuity and direction of the trajectory points for the identification of the trajectory points in GPS trajectory. Sex and density.

【技术实现步骤摘要】
基于密度的停留点识别方法
本专利技术属于轨迹数据挖掘
,涉及一种基于密度的停留点识别方法。
技术介绍
随着具有GPS功能的移动设备的普及和使用,移动对象(如人、车辆、动物等)的运动轨迹可以被记录和存储,GPS轨迹急剧膨胀。GPS轨迹蕴含着丰富的时空信息,通过分析GPS轨迹,可以发现移动对象的行为特性、活动规律、兴趣偏好等时空模式,进而为基于位置的服务(如兴趣点标注)、城市规划(如路线优化)、环境保护(如栖息地监测)等提供支持。因此,GPS轨迹分析备受关注。通常,GPS轨迹表示为按时间有序的轨迹点序列{(p0,&lt;x0,y0&gt;,t0),…,(pn-1,&lt;xn-1,yn-1&gt;,tn-1),其中任意轨迹点pi的坐标是&lt;xi,yi&gt;,时间是ti,且ti&lt;ti+1,表示移动对象在时间ti位于坐标为&lt;xi,yi&gt;的点pi。由于GPS轨迹的采集频率较高,其中的轨迹点并不是同等重要,有些轨迹点仅仅是移动对象瞬时经过的地方,例如,用户乘车经过的公交站,而有些轨迹点代表了移动对象在某个地方停留了一段时间,例如,用户在商场购物或在家中休息。这种反映移动对象在某个地方停留了一段时间的轨迹点集合称为停留点,识别GPS轨迹中的停留点是GPS轨迹分析的一个基本任务。目前公知的停留点识别方法主要是在距离阈值和时间阈值的约束下进行轨迹点聚类,距离阈值用于限定移动对象停留的最大地理范围,时间阈值用于限定移动对象停留的最短时间跨度。Ashbrook等(<Personal&UbiquitousComputing>,2003,7(5):275-286)采用K-means聚类算法、Zhou等(&lt;ACMInternationalWorkshoponGeographicInformationSystems&gt;,2004:266-273)采用基于密度的聚类方法识别停留点。Hariharan等(&lt;ThirdInternationalConferenceonGeographicInformationScience&gt;,2004:106-124)顺序遍历整个轨迹,将当前轨迹点作为锚点,向后寻找与锚点的时间跨度大于时间阈值的序号最小的轨迹点,然后判断这些点两两之间的最大距离是否小于距离阈值,若是,则将这些轨迹点判定为一个停留点,且序号最小轨迹点的下一轨迹点为当前轨迹点,若否,下一轨迹点变为当前轨迹点,重复上述步骤。Liu等(&lt;IEEEInternationalConferenceonMobileDataManagement&gt;,2006:73)使用了同样的方法识别停留点。Li等(&lt;ACMSigspatialInternationalConferenceonAdvancesinGeographicInformationSystems&gt;,2008:34)提出了与Hariharan等的方法不同的一种方法,该方法把距离阈值作为划分依据,把时间阈值作为判定依据。Pavan等(&lt;IEEEInternationalConferenceonMobileDataManagement&gt;,2015:110-115)在Li等的方法的基础上,增加了速度的限定。上述工作主要存在三个不足:1)这些方法对距离阈值比较敏感,当距离阈值较大时,识别停留点的能力会快速下降;2)这些方法没有考虑时间连续性或仅考虑了时间连续性的一个方向;3)这些方法不能较好地识别部分记录丢失的停留点,甚至会将一个停留点误认为相邻的两个停留点。
技术实现思路
本专利技术的目的在于提供一种基于密度的停留点识别方法,通过同时考虑轨迹点的时间连续性和方向性以及密度,解决现有技术无法识别某些停留点或距离阈值较大时识别停留点的能力下降的不足。本专利技术所采用的技术方案是,基于密度的停留点识别方法,具体按照以下步骤进行:步骤S1、对输入对象和输出对象格式的定义:输入对象是GPS轨迹,每个轨迹点采用的格式为(No,Latitude,Longitude,Date,Time),其中,No是轨迹点的编号,Latitude和Longitude是轨迹点的纬度和经度,Date和Time是轨迹点的日期和时间,根据轨迹点格式,GPS轨迹可抽象为按时间有序的轨迹点序列Tr={(p0,&lt;x0,y0&gt;,t0),…,(pn-1,&lt;xn-1,yn-1&gt;,tn-1)},对于任意轨迹点pi,其中,0≤i&lt;n-1,pi的编号No=i,纬度Latitude=xi,经度Longitude=yi,日期Date+时间Time=ti,并且ti&lt;ti+1;输出对象是停留点集合,给定距离阈值dt和时间阈值tt,根据停留点语义,每个停留点就是一个GPS轨迹点子序列Sp={(ps,&lt;xs,ys&gt;,ts),…,(pe,&lt;xe,ye&gt;,te)},其中,对于任意轨迹点pi和pj,pi和pj之间的距离Distance(pi,pj)≤2dt,此时,s≤i,j≤e,对于起点ps和终点pe,ps和pe之间的时间跨度Interval(ps,pe)=|te-ts|≥tt,此时,s和e或其后与锚点编号的组合表示起点和终点编号,每个停留点采用锚点及其邻域表达,即采用的格式为(No,Latitude,Longitude,ArriveTime,LeaveTime,StartPoint,EndPoint),其中,No是停留点的锚点编号,Latitude和Longitude是锚点的纬度和经度,ArriveTime和LeaveTime是锚点邻域的到达时间即起始时间和离开时间即终止时间,StartPoint和EndPoint是锚点邻域的起点和终点,根据停留点格式,锚点pa的编号No=a,纬度Latitude=xa,经度Longitude=ya,邻域[pas,pae]的到达时间ArriveTime=tas和离开时间LeaveTime=tae,起点StartPoint=pas和终点EndPoint=pae,锚点pa与邻域[pas,pae]中轨迹点pi之间的距离Distance(pa,pi)≤dt,此时,as≤i≤ae,邻域[pas,pae]中轨迹点pi和pj之间的距离Distance(pi,pj)≤2dt,此时,as≤i,j≤ae,邻域[pas,pae]的起点pas和终点pae之间的时间跨度Interval(pas,pae)=|tae-tas|≥tt;步骤S2、依次以GPS轨迹点序列Tr中的每个轨迹点pi作为锚点,此时记为pa,进行后向搜索、向前搜索、密度计算,在密度计算的同时,生成候选停留点列表CL;步骤S3、对候选停留点列表CL中的每个候选停留点(pi,[pis,pie])进行停留点识别、轨迹点更新,其中,候选停留点仅记录锚点pi及其邻域[pis,pie],在停留点识别、轨迹点更新的同时,进行候选停本文档来自技高网
...

【技术保护点】
1.基于密度的停留点识别方法,其特征在于,具体按照以下步骤进行:步骤S1、对输入对象和输出对象格式的定义:输入对象是GPS轨迹,每个轨迹点采用的格式为(No,Latitude,Longitude,Date,Time),其中,No是轨迹点的编号,Latitude和Longitude是轨迹点的纬度和经度,Date和Time是轨迹点的日期和时间,根据轨迹点格式,GPS轨迹可抽象为按时间有序的轨迹点序列Tr={(p0,

【技术特征摘要】
1.基于密度的停留点识别方法,其特征在于,具体按照以下步骤进行:步骤S1、对输入对象和输出对象格式的定义:输入对象是GPS轨迹,每个轨迹点采用的格式为(No,Latitude,Longitude,Date,Time),其中,No是轨迹点的编号,Latitude和Longitude是轨迹点的纬度和经度,Date和Time是轨迹点的日期和时间,根据轨迹点格式,GPS轨迹可抽象为按时间有序的轨迹点序列Tr={(p0,&lt;x0,y0&gt;,t0),…,(pn-1,&lt;xn-1,yn-1&gt;,tn-1)},对于任意轨迹点pi,其中,0≤i&lt;n-1,pi的编号No=i,纬度Latitude=xi,经度Longitude=yi,日期Date+时间Time=ti,并且ti&lt;ti+1;输出对象是停留点集合,给定距离阈值dt和时间阈值tt,根据停留点语义,每个停留点就是一个GPS轨迹点子序列Sp={(ps,&lt;xs,ys&gt;,ts),…,(pe,&lt;xe,ye&gt;,te)},其中,对于任意轨迹点pi和pj,pi和pj之间的距离Distance(pi,pj)≤2dt,此时,s≤i,j≤e,对于起点ps和终点pe,ps和pe之间的时间跨度Interval(ps,pe)=|te-ts|≥tt,此时,s和e或其后与锚点编号的组合表示起点和终点编号,每个停留点采用锚点及其邻域表达,即采用的格式为(No,Latitude,Longitude,ArriveTime,LeaveTime,StartPoint,EndPoint),其中,No是停留点的锚点编号,Latitude和Longitude是锚点的纬度和经度,ArriveTime和LeaveTime是锚点邻域的到达时间即起始时间和离开时间即终止时间,StartPoint和EndPoint是锚点邻域的起点和终点,根据停留点格式,锚点pa的编号No=a,纬度Latitude=xa,经度Longitude=ya,邻域[pas,pae]的到达时间ArriveTime=tas和离开时间LeaveTime=tae,起点StartPoint=pas和终点EndPoint=pae,锚点pa与邻域[pas,pae]中轨迹点pi之间的距离Distance(pa,pi)≤dt,此时,as≤i≤ae,邻域[pas,pae]中轨迹点pi和pj之间的距离Distance(pi,pj)≤2dt,此时,as≤i,j≤ae,邻域[pas,pae]的起点pas和终点pae之间的时间跨度Interval(pas,pae)=|tae-tas|≥tt;步骤S2、依次以GPS轨迹点序列Tr中的每个轨迹点pi作为锚点,此时记为pa,进行后向搜索、向前搜索、密度计算,在密度计算的同时,生成候选停留点列表CL;步骤S3、对候选停留点列表CL中的每个候选停留点(pi,[pis,pie])进行停留点识别、轨迹点更新,其中,候选停留点仅记录锚点pi及其邻域[pis,pie],在停留点识别、轨迹点更新的同时,进行候选停留点列表CL更新。2.根据权利要求1所述的基于密度的停留点识别方法,其特征在于,所述步骤S2包括:步骤S21、后向搜索是从锚点pa出发,沿时间维,重复步骤S211-S212,初始j=1:步骤S211、向后搜索一个轨迹点pa-j,判断pa-j是否已经超过GPS轨迹点序列Tr的起点,即判断是否a-j&lt;0,如是,则最后一个满足条件的轨迹点pas=pa-j+1=p0,后向搜索过程停止,如否,则继续步骤S212;步骤S212、判断pa-j与锚点pa的距离是否大于距离阈值dt,即判断是否Distance(pa,pa-j)&gt;dt,如是,则最后一个满足条件的轨迹点pas=pa-j+1,后向搜索过程停止,如否,则j:=j+1,继续步骤S211;步骤S22、前向搜索是从锚点pa出发,沿时间维,重复步骤S221-S222,初始j=1:步骤S221、向前搜索一个轨迹点pa+j,判断pa+j是否已经超过G...

【专利技术属性】
技术研发人员:李毓瑞陈红梅肖清王丽珍
申请(专利权)人:云南大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1