一种基于IC卡数据的公交串车预测方法技术

技术编号:12621437 阅读:56 留言:0更新日期:2015-12-30 19:07
本发明专利技术公开了一种基于IC卡数据的公交串车预测方法,属于公共交通信息处理技术领域。所述预测方法包括公交车IC卡数据采集、数据处理、实际公交串车情况检测、训练学习数据和公交串车预测,其中公交串车预测采用最小二乘支持向量机(LS-SVM)算法。本发明专利技术结合公交IC卡数据,针对多辆车次,提取大量的乘客信息,不需要车载GPS系统,方便快捷,降低了数据处理成本;同时采用最小二乘支持向量机方法能够更好更快更有效地实现公交串车预测,使乘客能够更好地了解公交运行情况,合理调控出行时间,使公交运营部门也能够及时调整公交发车间隔,提升公交服务水平;本发明专利技术处理数据简单,成本低,且有较高预测精度。

【技术实现步骤摘要】
一种基于IC卡数据的公交串车预测方法
本专利技术涉及公共交通信息处理
,具体地说是一种基于IC卡数据的公交串车预测方法。
技术介绍
在实际的公交运营过程中,由于交通拥堵、站点停靠时间和上下车人数的变化等因素影响,公交车辆的到站并不规律。特别是高峰时段,乘客常常在公交站台等上十分钟或者更久都不见有一辆公交车来,而一旦来车了却发现来的不止是一辆车,而是若干辆车同时到达,并且车辆的载客量往往不均匀。降低了公交的服务水平,引发安全危害。事实上,某辆公交车在某个站点的延误,可能会导致其到下一个站点的时间增加,同时造成下一个站点乘客量和等待时间的增加,进一步增加了该次公交车的延误时间。另一方面,下一车次的公交车承载的乘客量将会减少,同时减少了站点延误时间,缩短了与前车的时间间隔,这如同滚雪球效应,在之后的同一路线行走中,这两个公交车有很大可能在某一站点相遇。这种现象是公交串车现象。因此预测公交串车可以减少乘客等待时间,提高公交的服务水平,提升公交分担率。近年来,在一些大城市(如江苏南京、浙江杭州等)的公交站点,已经出现对公交车辆到站的预测,而针对公交串车情况进行预测的文献非常少。但是目前的公交车辆到站预测均是结合车载GPS系统,而且只针对于一辆车,给出其距离站点的距离及预计到站时间。这虽然能给予公交乘客一定的参考,但是实际上,在高峰时段,道路拥堵情况严重,导致公交串车现象,造成后续车辆先于前车进站,使得预测出的公交到站时间与乘客实际等待时间不符,且车载GPS系统要求大的存储空间,定位精度低,我们需要探寻更好的方法来解决上述问题。
技术实现思路
针对上述问题,本专利技术提供一种充分考虑某一车次到达下游站点的各相关因素、具有实时动态性能的基于IC卡数据的公交串车高精度预测方法。本专利技术基于公交IC卡数据,从乘客角度出发,预测相邻两车的到站间隔及公交串车,能够更好地了解公交运行情况,合理调控出行时间,提高出行效率;同时对于公交运营部门来说,也能够及时调整公交发车间隔,避免公交串车情况发生,更好提升公交服务水平。所述的一种基于IC卡数据的公交串车高精度预测方法,对同一个公交线路的两个相邻站点的多辆车次提取车次标识、线路标识、站点标识、到站时间和上下车客流量等信息。首先剔除两个站点的车次标识不对应的异常点,得到车次标识完全对应一致的数据,计算第二个站点按照第一个站点的车次顺序排列得到的车头时距,通过分析车头时距的正负来检测到达第二个站点实际的公交串车情况。若为正,说明没有发生串车,相反,若为负,说明发生了串车。然后要预测某一个车次到达第二个站点的公交串车情况,根据上述提取的线路标识、车次标识、到站时间和上下车客流量等数据,提取训练学习中每一天的小样本数据,包括两个站点的旅行时间、某一个车次在第一个站点的车头时距、某一车次和相邻上一车次分别在第一站点的上下车人数,以及相邻上一车次在第二个站点的上下车人数等信息,这些每一天的小样本数据组成一个大样本数据,根据所述的大样本数据建立预测模型,结合最小二乘支持向量机算法预测某一车次到达第二个站点的公交串车情况。本专利技术的优点在于:1、本专利技术结合公交IC卡数据,针对多辆车次,提取大量的乘客信息,不需要车载GPS系统,方便快捷,降低了数据处理成本;2、本专利技术采用最小二乘支持向量机方法能够更好更快更有效地实现公交串车预测,使乘客能够更好地了解公交运行情况,合理调控出行时间;同时使公交运营部门也能够及时调整公交发车间隔,提升公交服务水平;3、本专利技术考虑了上下车人数、到站时间、两站点间的旅行时间、两个相邻车次的车头时距等多个因素,处理数据简单,成本低,且有较高预测精度。附图说明图1为本专利技术所述的基于IC卡数据的公交串车预测方法的原理图;图2为本专利技术所述的基于IC卡数据的公交串车预测方法的流程图。具体实施方式下面结合附图和实施例对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。本专利技术提供一种基于IC卡数据的公交串车预测方法,包括以下步骤:第一步,公交车IC卡数据采集:通过3G传输网络实时获取公交车IC卡刷卡信息,建立公交运行线路和车辆运行信息数据库。所述的公交车IC卡数据包括车次标识、线路标识、站点标识、到站时间、日期和上下车客流量等信息。从上述采集到的全网IC卡数据中获取一条易发生串车的公交线路,在此条公交线路的基础上找寻相邻两个目标站点,并进一步提取每天经过上述两个目标站点的公交车车次以及每个车次到达这两个目标站点的到站时间、上下车人数。由于每天交通状况不一,所以公交公司发放的公交车次数不尽相同,可根据不同车辆号或车次间隔,提取每天的车次标识。第二步,数据处理:由于每天公交站点上下车人数具有随机性且不均匀,而且乘客刷卡信息也存在异常,需要进行车次标识匹配,将两个目标站点车次标识不对应的数据作为错误数据剔除,同时与车次标识对应的站点标识、到站时间和上下车客流量等信息也相应剔除,只保留两个目标站点具有相同车次标识的数据。第三步,实际公交串车情况检测:本专利技术将公交站点的公交串车情况分为二元状态,有串车情况的是1,没有串车情况的是0。根据第二步,在两个目标站点具有相同车次标识的情况下,第二个目标站点按照第一个目标站点的车次顺序排列得到的两相邻车次的车头时距(即Headway),可以得到实际的公交串车情况,若求得的车头时距为正,则说明没有串车情况,记为0;若求得的车头时距为负或者为0,则说明发生了串车情况,记为1。所述的第一个目标站点定义为两个相邻的目标站点中先到达的站点,所述的第二个目标站点定义为两个相邻的目标站点中后到达的站点。所述的两相邻车次的车头时距(即Headway),就是当前车次在某一个目标站点的到站时间与相邻上一车次在同一个目标站点的到站时间的差值。第四步,训练学习数据:要实时的预测当前车次到达第二个目标站点的公交串车情况,相关因素就包括相邻的上一个车次在第一个目标站点的到站时间和上下车人数、在第二个目标站点的到站时间和上下车人数,以及当前车次在第一个目标站点的到站时间和上下车人数。作为训练学习中的输入因素包括两个目标站点的旅行时间、两相邻车次在第一个目标站点之间的车头时距、相邻上一个车次和当前车次分别在第一个目标站点的上下车人数、以及相邻上一个车次在第二个目标站点的上下车人数。作为输出变量的因素只有1个,即公交串车情况。本专利技术中先提取每一天的小样本数据,然后按时间顺序组成一个大样本数据,按照训练集和测试集3:1的样本数据比例选出训练集。所述的两个目标站点的旅行时间,在车次标识对应的情况下,两个目标站点的旅行时间就是当前车次在第二个目标站点的到站时间和第一个目标站点的到站时间的差值。由于两个目标站点是存在站间距的,根据国家规定的公交车最高车速,两个目标站点间的旅行时间是一个正值并且大于某一个定值,所以要剔除不符合规定的旅行时间数据,同时对应的车次标识、站点标识、到站时间和上下车客流量等信息也相应剔除。第五步,公交串车预测:本专利技术采用最小二乘支持向量机算法预测公交串车情况,根据第四步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交串车情况进行预测,得到预测值。所述的最小二乘支持向量机(LS-SVM)算法是一种遵循结构风险最小化原则的核函数学习机器,L本文档来自技高网...
一种基于IC卡数据的公交串车预测方法

【技术保护点】
一种基于IC卡数据的公交串车预测方法,其特征在于:包括以下步骤,第一步,公交车IC卡数据采集:通过3G传输网络实时获取公交车IC卡刷卡信息,所述的公交车IC卡数据包括车次标识、线路标识、站点标识、到站时间、日期和上下车客流量信息;从上述采集到的IC卡数据中选取一条易发生串车的公交线路,在此条公交线路的基础上找寻相邻两个目标站点,并进一步提取每天经过上述两个目标站点的公交车车次以及每个车次到达这两个目标站点的到站时间和上下车人数;第二步,数据处理:需要做车次标识的匹配,将两个目标站点车次标识不对应的数据作为错误数据剔除,同时与车次标识对应的站点标识、到站时间和上下车客流量信息也相应剔除,只保留两个目标站点具有相同车次标识的数据;第三步,实际公交串车情况检测:在两个目标站点具有相同车次标识的情况下,第二个目标站点按照第一个目标站点的车次顺序排列得到两相邻车次的车头时距,若求得的车头时距为正,则说明没有串车情况,记为0;若求得的车头时距为负或者为0,则说明发生了串车情况,记为1;第四步,训练学习数据:要实时的预测当前车次到达第二个目标站点的公交串车情况,相关因素就包括相邻的上一个车次在第一个目标站点的到站时间和上下车人数、在第二个目标站点的到站时间和上下车人数,以及当前车次在第一个目标站点的到站时间和上下车人数;作为训练学习中的输入因素包括两个目标站点的旅行时间、相邻两个车次在第一个目标站点之间的车头时距、相邻上一个车次和当前车次分别在第一个目标站点的上下车人数、以及相邻上一个车次在第二个目标站点的上下车人数;作为输出变量的因素只有1个,即公交串车情况;先提取每一天的小样本数据,然后按时间顺序组成一个大样本数据,按照训练集和测试集3:1的样本数据比例选出训练集;第五步,公交串车预测:采用最小二乘支持向量机算法预测公交串车情况,根据第四步中选取的训练集建立预测模型对当前车次到达第二个目标站点的公交串车情况进行预测,得到预测值。...

【技术特征摘要】
1.一种基于IC卡数据的公交串车预测方法,其特征在于:包括以下步骤,第一步,公交车IC卡数据采集:通过3G传输网络实时获取公交车IC卡刷卡信息,所述的公交车IC卡数据包括车次标识、线路标识、站点标识、到站时间、日期和上下车客流量信息;从上述采集到的IC卡数据中选取一条易发生串车的公交线路,在此条公交线路的基础上找寻相邻两个目标站点,并进一步提取每天经过上述两个目标站点的公交车车次以及每个车次到达这两个目标站点的到站时间和上下车人数;第二步,数据处理:需要做车次标识的匹配,将两个目标站点车次标识不对应的数据作为错误数据剔除,同时与车次标识对应的站点标识、到站时间和上下车客流量信息也相应剔除,只保留两个目标站点具有相同车次标识的数据;第三步,实际公交串车情况检测:在两个目标站点具有相同车次标识的情况下,第二个目标站点按照第一个目标站点的车次顺序排列得到两相邻车次的车头时距,若求得的车头时距为正,则说明没有串车情况,记为0;若求得的车头时距为负或者为0,则说明发生了串车情况,记为1;第四步,训练学习数据:要实时的预测当前车次到达第二个目标站点的公交串车情况,相关因素就包括相邻的上一个车次在第一个目标站点的到站时间和上下车人数、在第二个目标站点的到站时间和上下车人数,以及当前车次在第一个目标站点的到站时间和上下车人数;作为训练学习中的输入因素包括两个目标站点的旅行时间、相邻两个车次在第一个目标站点之间的车头时距、相邻上一个车次和当前车次分别在第一个目标站点的上下车人数、以及相邻上一个车次在第二个目标站点的上下车人数;作为输出变量的因素只有1个,即公交串车情况;先提取每一天的小样本数据,然后按时间顺序组成一个大样本数据,按照训练集和测试集3:1的样本数据比例选出训练集;第五步,公交串车预测:...

【专利技术属性】
技术研发人员:马晓磊陈栋伟于海洋
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1