当前位置: 首页 > 专利查询>戴大蒙专利>正文

一种基于网络数据源的公交到站信息轨迹生成方法技术

技术编号:8105781 阅读:217 留言:0更新日期:2012-12-21 04:38
本发明专利技术提供一种基于网络数据源的公交到站信息轨迹生成方法,包括获取公交到站信息数据和生成公交到站信息轨迹链路两部分,最后将输出的公交到站信息轨迹的完整链路保存到相应数据库中,生成公交到站信息轨迹链路是将提取的上述公交信息转化为链路片段,然后采用最小拼接距离链路拼接方法将所述链路片段进行拼接,输出公交到站信息轨迹的完整链路,保存到相应数据库中。本发明专利技术的基于网络数据源的公交到站信息轨迹生成方法抑制了网络数据源的各种信息干扰,从提取的公交到站信息轨迹中获取公交车在各站点上不同时间段的行驶时间,为进一步的城市路况软测量和公交信息服务等研究和云计算与服务奠定基础。

【技术实现步骤摘要】

本专利技术 涉及基于网络数据源的交通信息数据挖掘与云计算
,具体涉及。
技术介绍
近年来,随着“公交优先”政策的有效落实和城市智能公交信息化的建设,我国在杭州、苏州、上海、北京、大连、广州、柳州、厦门等城市部分或全部公交线路的公交车上安装了 GPS定位系统和电子站牌,使得候车者可查询公交的实时到站信息,提高了公共交通服务质量,增强了市民的公交出行意愿,公交出行率的提高对城市交通疏堵和节能环保均有重要意义。部分城市建设了公交到站信息在线查询网站,使得公交乘坐者可通过因特网的网络数据源查询每路车或者某一站点相应线路的公交车到站情况。然而对很多在线查询系统,网络数据源只提供公交进站时间,不提供到站公交车的识别号,因而网络数据源采集出的数据无法区分哪些进站信息是由同一辆公交车产生的,致使无法通过网络在线数据直接获取每一辆公交车在各路段和时间段的行驶时间。公交行车信息是开展城市交通路网路况软测量、公交行车优化、公交预报等相关研究的重要数据,因此如何从在线系统的网络数据源中采集的公交行车数据提取每一辆公交车的到站信息,即每一辆车的公交到站信息轨迹的提取是开展相关研究所需解决的首要问题。受GPS设备、公交查询系统自身原因、Http连接阻塞等诸多因素影响,通过网络数据源获取的实际数据,存在一定程度的信息丢失和异常数据,使得公交到站信息轨迹的可靠提取具有一定的难度。图I是2011年9月2日通过http://m. sz-map. com的网络数据源获取的苏州10路北线公交的实时到站信息时空图,纵坐标为站点索引号,横坐标为到站时间,黑点为采集到的到站信息。由图I可见,对实际采集的信息存在一定程度的信息缺失和干扰,例如I)始发站或终点站存在过多的异常信息。当公交车处于始发或终点站时,该公交车尽管没有处于行驶状态,但车载GPS可能依然保持工作,并向服务器发送位置信息,图I中A区所示,可能是同一辆公交车对始发站产生的站点信息,该车在发车前GPS依然保持工作,向服务器发送位置信息。这些多余的位置信息会影响公交到站信息轨迹的正确提取。2)存在较长时间的信息丢失。城市中的建筑密集区、天气恶劣等均可能对GPS信号产生影响,导致GPS位置信息漂移或者信号丢失,另外数传模块GPRS亦可能受到网络阻塞等影响,导致公交车的位置信息无法回传至服务器,这些因素会导致公交车位置信息的数据不全,更甚者会出现连续6个以上的站点信息丢失。图I中的B区,BI与B2是同一辆公交车产生的位置信息,期间缺失3个站点的信息,而B3、B4间则缺失了 4个站点信息,经验证,在该段时间内,本地服务器采集周期维持在30s左右,排除了网络阻塞造成的信息丢失因素,系公交系统自身原因造成。缺失信息会破坏信息的完整性,增加了公交到站信息轨迹提取难度。3)存在逆行线信息干扰。许多城市的公交车上下行线需要司机手工切换,有的司机有时粗心,在公交车到达终点站后没有切换上下行线路,从而在下行线的路线上发出的位置信息依然被服务器认为是上行线信息,服务器进行错误的解析会导致位置信息时空图上形成一条反向行车轨迹,例如图I中C区中形成了一条反向行车轨迹。造成该现象的原因可能是该辆公交车到达终点站后对GPS系统没有切换上下行线,导致反程中所发送的公交到站信息被服务器错误解析。逆行线干扰信息在数据稠密处会严重干扰公交到站信息轨迹的正确生成。4)非始发站或终点站的异常信息干扰。公交车行驶过程中,由于信号干扰或者GPS信号漂移以及服务器自身的完善度不够,在同一辆公交车上会产生同一个站点的多个到站时间,例如图I中D区的D1、D2、D3、D4为公交车行驶过程中在同一站点产生的4个位置信息,对于公交到站信息轨迹生成需要剔除多余的干扰信息。
技术实现思路
为此,本专利技术所要解决的是网络数据源实际采集的信息存在一定程度的信息缺失和干扰从而干扰公交到站信息轨迹生成的技术问题,提供。为解决上述技术问题,本专利技术采用的技术方案包括如下步骤,具体步骤如下第一步获取公交到站信息数据通过连接公交实时到站信息查询网,发送对应线路的URL地址,通过Http Get方式获得查询结果,通过解析网页响应源码,提取公交线路、站点名称、站点索引号、进站时间的公交信息;第二步生成公交到站信息轨迹链路,过程如下(I)首先将提取的上述公交信息转化为链路片段,包括链路片段初始化过程和链路片段生成过程两部分,所述链路片段初始化过程用于生成初始的链路片段集和链路映射,所述链路片段生成过程生成链路片段;(2)然后采用最小拼接距离链路拼接方法将所述链路片段进行拼接,输出公交到站信息轨迹的完整链路;第三步将输出公交到站信息轨迹的完整链路保存到相应数据库中。所述的基于网络数据源的公交到站信息轨迹生成方法,所述链路片段初始化过程将首条有效的公交到站记录信息分解成若干辆公交车的行车数据,每一辆公交车对应一个链路片段,该过程通过非零索引集的操作实现。所述的基于网络数据源的公交到站信息轨迹生成方法,所述链路片段初始化过程的具体步骤如下Al :给相关变量进行初始化设置,记录集索引η = 1,链路片段索引k = 1,链路映射 Ψ = O ; A2:根据η索引值,取得当前记录& = 3,并由非零索引集操作,取得Rp的非零索引集Z;,=Z(WA3:判断链路片段索引k是否超出&元素个数,如果未超出,则跳至步骤A5 ;否则运行步骤A4;A4:取出非O值站点的索弓|x = &(X);通过Ω = Rp实现当前记录Rp中的非O站点信息(χ站点信息)加到链路片段集Ω中;通过Ψ = k进行链路映射更新,用于表示当前最近第χ站点的信息是由Ω 产生的;更新链路索引k值自增I ;跳至步骤A3 ;A5:分别通过R1 = Rp和之=更新上条记录和上条记录的非零索引集;更新记录集索引值η自增I ;记S e识〃-为公交到站原始记录信息,邓]e 为第i条记录,S 为第i条记录中第j站点的公交到站信息,若s =0表示无公交到站信息,S 的非O值则为第i条记录中公交到达j站点的时间;/eiKlxM为强关联生成片段,l为站点i在生成片段I中的记录,Ω^/}为片段记录集为记录站点最近更新链路片段索引值映射,即Ψ值表示第i站点的最近有效更新值所在链路片段I在Ω中的索引值;f(F)表示向量V中非零索引集,& 4风《I表示当前记录,式$风为上一条记录,η为记录索引号;所有集合元素从I开始索引。所述的基于网络数据源的公交到站信息轨迹生成方法,所述链路片段生成过程利用记录信息的时间先后顺序与公交车运行的强关联度特性,将同一公交车同一班次产生的到站信息放入同一链路片段中,该过程通过引入异元索引集、非零索引集、正向异元索引集、站点记录相似度,实现相邻两条记录相关站点信息的快速提取和关联度计算,并运用相似度的上下限阀值制定站点信息加入链路片段的规则,在链路片段的生成过程中充分考虑链路映射的防覆盖处理。所述的基于网络数据源的公交到站信息轨迹生成方法,所述链路片段生成过程的具体步骤如下BI :获取链路初始化后的各变量状态,具体的变量是记录集索引η = 2,上条记录R1,上条记录非零索引隼之链路片段集Ω,链路映射Ψ ;Β2 :赋值当前记录Rp = S,取当前记录Rp与上一条记录R1的异元本文档来自技高网
...

【技术保护点】
一种基于网络数据源的公交到站信息轨迹生成方法,其特征在于:具体步骤如下:第一步:获取公交到站信息数据:通过连接公交实时到站信息查询网,发送对应线路的URL地址,通过Http?Get方式获得查询结果,通过解析网页响应源码,提取公交线路、站点名称、站点索引号、进站时间的公交信息;第二步:生成公交到站信息轨迹链路,过程如下:(1)首先将提取的上述公交信息转化为链路片段,包括链路片段初始化过程和链路片段生成过程两部分,所述链路片段初始化过程用于生成初始的链路片段集和链路映射,所述链路片段生成过程生成链路片段;(2)然后采用最小拼接距离链路拼接方法将所述链路片段进行拼接,输出公交到站信息轨迹的完整链路;第三步:将输出公交到站信息轨迹的完整链路保存到相应数据库中。

【技术特征摘要】

【专利技术属性】
技术研发人员:戴大蒙童长飞
申请(专利权)人:戴大蒙
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1