本发明专利技术适用于智能交通技术领域,提供了一种出租车轨迹热点区域分析方法及系统,所述方法包括:获取出租车的轨迹数据集并进行时序分析,得到划分时间段;对轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集并确定密度分界值;对于某个划分时间段,确定该划分时间段内各个划分区域对应的第二轨迹数据集,并计算各个第二轨迹数据集对应的区域密度;基于所述区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值后对各个第二轨迹数据集进行聚类,确定该划分时间段内出租车轨迹的热点区域。本申请能够客观、准确地得到不同时段居民出行的热点区域,从而降低出租车空载率。
【技术实现步骤摘要】
一种出租车轨迹热点区域分析方法及系统
本专利技术属于智能交通
,尤其涉及一种出租车轨迹热点区域分析方法及系统。
技术介绍
出租车由于具有快捷、方便的优点,已经成为当前社会的重要交通方式。对于出租车行业而言,出租车的行驶轨迹很大程度上取决于城市居民的出行路线,因此,对出租车轨迹数据进行处理和分析,准确、客观地获得居民出行的热点区域,能够显著减少出租车的空载率,甚至对规避城市交通堵塞、规划城市建设都具有重要意义。
技术实现思路
有鉴于此,本专利技术实施例提供了一种出租车轨迹热点区域分析方法及系统,以准确、客观地获得居民出行的热点区域。本专利技术实施例的第一方面提供了一种出租车轨迹热点区域分析方法,包括:获取出租车的轨迹数据集;对轨迹数据集进行时序分析,得到划分时间段;对轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集,并基于第一轨迹数据集确定密度分界值;对于某个划分时间段,确定该划分时间段内各个划分区域对应的第二轨迹数据集,并计算各个第二轨迹数据集对应的区域密度;基于区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值,并基于聚类半径和聚类密度阈值对各个第二轨迹数据集进行聚类,确定该划分时间段内出租车轨迹的热点区域。本专利技术实施例的第二方面提供了一种出租车轨迹热点区域分析系统,包括:获取模块,用于获取出租车的轨迹数据集;数据处理模块,用于对轨迹数据集进行时序分析,得到划分时间段;对轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集,并基于第一轨迹数据集确定密度分界值;对于某个划分时间段,确定该划分时间段内各个划分区域对应的第二轨迹数据集,并计算各个第二轨迹数据集对应的区域密度;聚类模块,用于基于区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值,并基于聚类半径和聚类密度阈值对各个第二轨迹数据集进行聚类,确定该划分时间段内出租车轨迹的热点区域。本专利技术实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述出租车轨迹热点区域分析方法的步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述出租车轨迹热点区域分析方法的步骤。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术结合时间和空间两方面综合分析出租车的轨迹数据,在时间上对轨迹数据集进行时序分析,得到划分时间段,在空间上划分多个区域,确定各划分时间段内各个划分区域对应的第二轨迹数据集,并根据各第二轨迹数据集对应的区域密度和预先计算的密度分界值的大小关系,选取不同的聚类半径和聚类密度阈值进行聚类,能够客观、准确地得到不同时段居民出行的热点区域,从而降低出租车的空载率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的出租车轨迹热点区域分析方法的流程示意图;图2是本专利技术实施例提供的对第二轨迹数据集进行聚类的流程示意图;图3是本专利技术实施例提供的出租车轨迹热点区域分析系统的结构示意图;图4是本专利技术实施例提供的电子设备的结构示意图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。为了说明本专利技术所述的技术方案,下面通过具体实施例来进行说明。本申请实施例的第一方面提供了一种出租车轨迹热点区域分析方法,参照图1所示,该方法可以包括以下步骤:步骤S101,获取出租车的轨迹数据集;对轨迹数据集进行时序分析,得到划分时间段;对轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集,并基于第一轨迹数据集确定密度分界值。在本专利技术实施例中,对轨迹数据集进行空间划分可以通过将轨迹数据与路网地图进行匹配来实现。首先通过OpenStreetMap开源地图网站获取城市路网地图,然后将轨迹数据集内的轨迹数据与路网地图进行匹配,确定出租车的行驶范围,并对行驶范围进行区域划分,可以得到各个划分区域对应的第一轨迹数据集,通过计算各第一轨迹数据集对应的区域密度,根据各区域密度之间的差值大小确定高密度区域和低密度区域的密度分界值λ。可选的,在对轨迹数据集进行时序分析,得到划分时间段之前,还包括:对轨迹数据集进行预处理。在本专利技术实施例中,由于GPS信号的不稳定性,会导致轨迹数据异常,例如部分轨迹数据的缺失或重复等,需要对轨迹数据集内的轨迹数据进行预处理,修复异常的轨迹数据。另外,获取的出租车轨迹数据信息包括以一定的时间间隔进行采集的出租车位置经纬度信息和各时刻下出租车的载客状态,通过预处理筛选出呈载客状态的出租车轨迹数据作为居民出行热点区域分析的有效数据。可选的,对轨迹数据集进行时序分析,得到划分时间段,包括:对轨迹数据集内的轨迹数据进行差分计算,确定轨迹数据随时间的变化规律;根据该变化规律,确定轨迹数据集的划分时间段。在本专利技术实施例中,对轨迹数据集进行时间序列特征分析(时序分析)可以通过Hadoop平台来实现。出租车轨迹数据的时间序列是指将出租车轨迹数据按时间发展顺序排列形成的序列,记录了每辆车每日从6:00-24:00的时间范围内,每个GPS信号传输时刻的经纬度坐标点。时序分析是在Hadoop平台轨迹数据中选取某一周内的轨迹数据,统计每天出租车载客量,对非平稳的时间序列进行差分计算,得到一周内每天出租车载客量的变化规律,观察该变化规律得到工作日和节假日时间段;以及选取工作日和节假日一天的轨迹数据,统计6:00-24:00每个小时的出租车载客量,对其进行差分计算,得到工作日和节假日一天内每小时出租车载客量的变化规律,观察该变化规律得到工作日和节假日一天内出租车载客高峰时间段和非高峰时间段。具体的,例如对选定的某一周内出租车轨迹数据进行每天载客量的统计和非平稳时间序列的差分计算如下:设自变量为时间序列t,yt是t的函数,记作yt=f(t),表示出租车每天载客量,当自变量t改变为t+1时,相应的函数值之差为yt=f(t)在t的一阶差分,记作Δyt,即Δyt=yt+1-yt=f(t+1)-f(t)。当一阶差分Δyt为正值时,表明当前出租车载客量较之前一天是增加的,且其值越大,载客量增加的越快;当一阶差分Δyt为负值时,表明当前出租车载客量较之前一天是减少的。同样,对某天出租车载客量进行差分计算,函数值为每小时的本文档来自技高网...
【技术保护点】
1.一种出租车轨迹热点区域分析方法,其特征在于,包括:/n获取出租车的轨迹数据集;对所述轨迹数据集进行时序分析,得到划分时间段;对所述轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集,并基于所述第一轨迹数据集确定密度分界值;/n对于某个划分时间段,确定该划分时间段内各个划分区域对应的第二轨迹数据集,并计算各个第二轨迹数据集对应的区域密度;基于所述区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值,并基于所述聚类半径和聚类密度阈值对各个第二轨迹数据集进行聚类,确定该划分时间段内出租车轨迹的热点区域。/n
【技术特征摘要】
1.一种出租车轨迹热点区域分析方法,其特征在于,包括:
获取出租车的轨迹数据集;对所述轨迹数据集进行时序分析,得到划分时间段;对所述轨迹数据集进行空间划分,得到各个划分区域对应的第一轨迹数据集,并基于所述第一轨迹数据集确定密度分界值;
对于某个划分时间段,确定该划分时间段内各个划分区域对应的第二轨迹数据集,并计算各个第二轨迹数据集对应的区域密度;基于所述区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值,并基于所述聚类半径和聚类密度阈值对各个第二轨迹数据集进行聚类,确定该划分时间段内出租车轨迹的热点区域。
2.如权利要求1所述出租车轨迹热点区域分析方法,其特征在于,在对所述轨迹数据集进行时序分析,得到划分时间段之前,还包括:
对所述轨迹数据集进行预处理。
3.如权利要求1所述出租车轨迹热点区域分析方法,其特征在于,所述对所述轨迹数据集进行时序分析,得到划分时间段,包括:
对所述轨迹数据集内的轨迹数据进行差分计算,确定所述轨迹数据随时间的变化规律;
根据所述变化规律,确定所述轨迹数据集的划分时间段。
4.如权利要求1所述出租车轨迹热点区域分析方法,其特征在于,所述基于所述区域密度和密度分界值,确定各个第二轨迹数据集的聚类半径和聚类密度阈值,包括:
对于某一个第二轨迹数据集,判断其对应的区域密度与密度分界值的大小关系,若所述区域密度不小于所述密度分界值,则将第一预设半径和第一预设密度阈值分别作为所述第二轨迹数据集的聚类半径和聚类密度阈值;
若所述区域密度小于所述密度分界值,则将第二预设半径和第二预设密度阈值分别作为所述第二轨迹数据集的聚类半径和聚类密度阈值。
5.如权利要求1所述出租车轨迹热点区域分析方法,其特征在于,所述基于所述聚类半径和聚类密度阈值对各个第二轨迹数据集进行聚类,包括:
将所述第二轨迹数据集内的轨迹数据均标记为未访问状态,并选取任意一个未被访问的轨迹数据,判断其邻域内的轨迹数据个数与聚类密度阈值的大小关系;其中所述邻域的半径为聚类半径;
若所述邻域内的轨迹数据个数不小于聚类密度阈值,则以该邻域对应的轨迹数据...
【专利技术属性】
技术研发人员:任丹萍,刘琳,陈湘国,魏忠诚,赵继军,李志华,
申请(专利权)人:河北工程大学,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。