基于时空聚类分析算法的交通出行起讫点识别方法技术

技术编号:15238467 阅读:115 留言:0更新日期:2017-04-29 03:04
本发明专利技术公开了一种基于时空聚类分析算法的交通出行起讫点识别方法,用手机GPS定位仪采集居民一天完整出行时空定位数据;对采集的数据进行预处理,剔除异常数据并修补缺失数据;利用基于密度的时空聚类分析算法识别交通出行起讫点;按不同用户及用户出行时间顺序统计形成最终交通出行起讫点识别结果。本发明专利技术充分利用了手机GPS定位技术高精度、可连续追踪出行轨迹的特征,并发挥基于密度的时空聚类分析算法的识别优势,解决传统空间聚类算法在识别实际出行端点上的不足,实现利用手机定位数据进行居民交通出行起讫点信息智能识别。该方法可用于大范围、自动化的居民交通出行起讫点信息采集。

【技术实现步骤摘要】

本专利技术属于交通数据采集中居民出行调查领域,尤其涉及一种利用基于密度的时空聚类分析算法对手机GPS定位数据进行分析、处理,从而识别个体交通出行中交通出行起讫点时空位置信息的流程与方法。
技术介绍
随着社会经济的不断发展,居民的日常交通出行种类与次数都在不断增加。随之而来的是各大城市的交通拥堵现象日益严重,直接影响到社会经济发展和居民交通出行质量。居民交通出行起讫点信息(即居民从哪儿到哪儿)的获取可以为整个城市居民交通出行现状分析提供重要依据,具体包含居民人均出行次数,城市热点地区的识别,客流集散地的集散现象分析等。目前,用于获取居民交通出行起讫点信息的方法主要有两种:(1)居民出行调查。居民出行调查是目前应用最为广泛的居民出行起讫点信息获取方法,主要包含入户纸质问卷、电话采访以及邮件访问等常见调查形式,居民出行调查依靠受访者回忆过去一天或多天的交通出行起讫点来完成信息采集,因此该方法受被调查者主观配合程度及记忆水平影响较大。其主要缺点有:1.受访者不愿意参与调查或调查随意性过强,主观回忆偏差、错误现象较为普遍,并且很多短途或短时间出行信息常常会被遗漏,数据质量无法得到可靠保障;2.调查工序繁琐、组织难度大,通常开展居民出行调查需要交通局、公安局以及街道办事处等多部门协调完成,调查组织难度较大,并且入户调查前的问卷设计、调查人员培训、人员组织与分工等比较繁琐,需要耗费大量的人力物力。(2)利用手机GPS数据来提取居民出行起讫点信息。目前用于处理手机GPS数据来提取出行起讫点信息的方法主要是“基于规则的方法”(rule-basedmethod),通过设定一定的速度阈值、相邻轨迹点距离阈值及相应的停留时长阈值等依据一定规则,设置一定的限制条件进行不断分类,最终将完整的出行链GPS轨迹点分为出行起讫轨迹点和出行移动轨迹点。但是这类方法的相应阈值设定以及规则设定主要依据主观经验,缺乏相应的数据支撑,同时,这类方法不考虑GPS轨迹点的空间分布信息,技术应用范围有一定的局限。本专利技术提出利用基于密度的时空聚类分析算法来处理手机GPS数据提取出行起讫点信息的方法能够有效避免上述缺陷。首先,手机GPS定位仪能够连续采集居民出行全程时空轨迹信息,通过对手机GPS时空定位数据的挖掘与处理分析,有望高精度识别出行全程交通出行起讫点信息。该技术能够避免传统调查法中受访者主观回忆偏差或信息遗漏现象,数据更加客观真实;此外,手机GPS定位数据精度较高,数据更新周期可控,并且借助目前已广泛普及的智能手机,该技术在数据采集内容、质量以及成本方面都得到显著改善。同时,本专利技术提出应用基于密度的时空聚类分析算法进行交通出行起讫点识别,算法参数标定依据采集客观数据的统计分析确定,有效避免了现有依靠主观经验识别技术的主观缺陷,识别过程智能、高效,技术适用范围更广,具有很好的行业应用前景。
技术实现思路
为了克服现有技术的上述缺点,本专利技术提出一种基于时空聚类分析算法的交通出行起讫点识别方法,运用手机GPS定位数据分析提取居民交通出行起讫点信息,提出异常轨迹数据剔除、缺失轨迹数据修补的数据预处理方法,在此基础上,创造性提出应用基于密度的时空聚类分析算法对手机GPS仪记录的GPS轨迹数据进行交通出行起讫点识别,提出了数据处理的整套方法。该技术最终能将居民一天或多天完整的交通出行切割成多个单次出行,并包含每次出行起讫点的时空位置信息。本专利技术解决其技术问题所采用的技术方案是:一种基于时空聚类分析算法的交通出行起讫点识别方法,包括如下步骤:步骤一、用手机GPS定位仪采集居民一天完整出行时空定位数据;步骤二、对步骤一采集的数据进行预处理,剔除异常数据并修补缺失数据;步骤三、利用基于密度的时空聚类分析算法识别交通出行起讫点;步骤四、按不同用户及用户出行时间顺序统计形成最终交通出行起讫点识别结果,包含居民一天完整出行过程中所有出行起讫点的时间段和位置信息。与现有技术相比,本专利技术的积极效果是:针对我国目前居民日常交通出行起讫点信息采集方法复杂,费用昂贵,数据质量较低等问题,提出一种基于手机GPS定位数据的交通出行起讫点智能识别方法。运用手机GPS定位仪采集居民多种出行目的类型的出行时空特征数据,在此基础上,将居民出行过程分为两类:出行当中的运动状态和出行起讫点停留状态,出行起讫点的GPS轨迹点会聚集在一起,空间密度较大,而出行当中的GPS轨迹点较为分散,空间密度较小。进而利用基于密度的时空聚类分析算法对交通出行起讫点进行识别,并提取出每次出行起讫点发生的时间段、地理位置等信息。本专利技术的优点在于:充分利用了手机GPS定位技术高精度、可连续追踪出行轨迹的特征,并发挥基于密度的时空聚类分析算法的识别优势,解决传统空间聚类算法在识别实际出行端点上的不足,实现利用手机定位数据进行居民交通出行起讫点信息智能识别。该方法可用于大范围、自动化的居民交通出行起讫点信息采集。附图说明本专利技术将通过例子并参照附图的方式说明,其中:图1为个体出行链GPS轨迹时空分布图;图2为核心对象,边界对象和噪声示意图:(a)DBSCAN中的核心对象;(b)本专利技术中的核心对象;(c)直接密度可达;图3为出行起讫点停留时长累计概率分布图;图4为553临近距离折线图。具体实施方式一种基于时空聚类分析算法的交通出行起讫点识别方法,先用手机GPS定位仪采集居民一天完整出行时空定位数据,将数据按照用户编号、出行时间顺序有序导入计算机数据库中存储与管理;再利用Matlab软件调用原始数据进行数据预处理,剔除异常数据、修补缺失数据;在此基础上,利用基于密度的时空聚类分析算法对手机GPS采集的轨迹数据进行交通出行起讫点识别;最后,根据不同用户及用户出行时间顺序,将识别结果进行整理统计,形成最终交通出行起讫点识别结果,包含居民一天完整出行过程中所有出行起讫点的时间段、位置信息。所述方法中主要包含下述处理步骤:步骤一:手机GPS定位数据采集及数据库创建1)数据采集:利用手机GPS定位仪采集居民出行时空特征数据,具体包括出行时间、卫星数、定位经纬度、速度等。轨迹点的时间、经纬度数据用于判断是否满足点簇聚类,是否存在出行起讫点的条件。同时可用于表达不同交通出行起讫点发生的时间段和地理位置信息,如图1所示。数据采集时,用户应在一天离开家出发前2-3分钟打开数据采集软件预热,并确保出行过程中软件始终处于开启状态,回家后2-3分钟后关闭软件。数据采集时间间隔应以1秒为宜,间隔过长会增大交通出行起讫点识别误差。由于时空聚类分析算法需进行参数标定,20%的用户需在出行的同时记录出行日志,包含其真实出行起讫点的时间。2)手机GPS定位数据库创建:数据采集结束后,将手机GPS定位数据导入计算机中,并根据用户编号、调查时间先后顺序将所有数据进行分类存储,形成基础数据库供后续数据分析和处理。步骤二:数据预处理1)异常数据剔除:由于城市峡谷效应和建筑物遮挡时手机GPS信号会较弱,在较弱条件下,GPS轨迹点往往会发生较大的位置偏移,4颗可见卫星是准确定位的前提条件,删除可见卫星数少于4颗的定位记录;其次、删除瞬时速度变化值大于25km/h的定位记录,减少手机运行问题造成的误差。2)缺失数据修补:由于用户在地下或室内活动时,手机GPS定位仪本文档来自技高网
...

【技术保护点】
一种基于时空聚类分析算法的交通出行起讫点识别方法,其特征在于:包括如下步骤:步骤一、用手机GPS定位仪采集居民一天完整出行时空定位数据;步骤二、对步骤一采集的数据进行预处理,剔除异常数据并修补缺失数据;步骤三、利用基于密度的时空聚类分析算法识别交通出行起讫点;步骤四、按不同用户及用户出行时间顺序统计形成最终交通出行起讫点识别结果,包含居民一天完整出行过程中所有出行起讫点的时间段和位置信息。

【技术特征摘要】
1.一种基于时空聚类分析算法的交通出行起讫点识别方法,其特征在于:包括如下步骤:步骤一、用手机GPS定位仪采集居民一天完整出行时空定位数据;步骤二、对步骤一采集的数据进行预处理,剔除异常数据并修补缺失数据;步骤三、利用基于密度的时空聚类分析算法识别交通出行起讫点;步骤四、按不同用户及用户出行时间顺序统计形成最终交通出行起讫点识别结果,包含居民一天完整出行过程中所有出行起讫点的时间段和位置信息。2.根据权利要求1所述的基于时空聚类分析算法的交通出行起讫点识别方法,其特征在于:步骤三所述利用基于密度的时空聚类分析算法识别交通出行起讫点的方法为:(1)确定Ε邻域内的样本点数MinPts:以累计概率达到特定百分比的出行端点停留时长作为MinPts;(2)确定空间距离半径Eps:统计每个轨迹点的邻域内包含MinPts个点时所需的邻域半径,并绘制成折线图,找出折线图中存在的拐点,以此拐点的距离作为Eps;(3)确定时间距离△T:△T=MinPts;(4)以上述三个参数作为相应的点簇拓展条件寻找密度相连对象的最大集合作为点簇,将这些点簇作为出行起讫点,点簇的时长即为出行起讫点停留时长,点簇的经纬度位置即为起讫点地理位置。3.根据权利要求2所述的基于时空聚类分析算法的交通出行起讫点识别方法,其特征在于:根据点簇拓展条件寻找密度相连对象的最大集合作为点簇的方法为:从任选一个未被访问过的点开始,找出与其距离在Eps与△T之内的所有附近点;如果附近点的数量大于等于MinP...

【专利技术属性】
技术研发人员:杨飞周建尧戴露
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1