基于一票制公交IC卡数据推算上车站点的方法技术

技术编号:5357030 阅读:261 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于一票制公交IC卡数据推算上车站点的方法,包括如下步骤:a.根据刷卡记录的时间将目标公交车的刷卡记录进行聚类,刷卡时间相近的刷卡记录为一个聚类,每个聚类对应一个站点,形成待识别站点序列;b.根据每张IC卡的相邻的刷卡记录确定换乘信息;c.根据换乘信息以及公交线路之间的交叉点数据信息,以及公交线路的站点信息,推算出该IC卡所在聚类对应的实际站点,形成已识别站点序列;d.根据已识别站点序列推算待识别的聚类对应的实际待识别的站点,当已识别站点数量小于2时,用移动步距的贝叶斯决策树法推算;当已识别的聚类数量大于等于2,采用模式识别的方法推算。本发明专利技术方法对数据要求低,且精度较高。

【技术实现步骤摘要】

本专利技术涉及公共交通信息处理
,具体地说是一种基于一票制公交IC卡 数据推算上车站点的方法。
技术介绍
公交客流信息,特别是客流在时间、空间上的分布信息是公交规划、决策的数据基 础。以往,公交客流信息多采用人工调查的手段获取,不仅样本量有限,而且消耗大量的人 力、物力,同时由于数据经过采集、录入、分析等多个环节,质量不容易保证。随着IC卡在 公交系统中的应用和普及,对IC卡数据进行处理、分析,得到城市公交客流数据成为可能。 公交IC卡数据不仅数据量巨大,远高于抽样调查的比例,而且在数据处理方法可靠的前提 下,数据质量也容易保证,这项技术也正引起越来越多人的注意。公交IC卡数据的格式因刷卡制度的不同而异。公交IC卡数据的最主要的目的是 用于公交运营公司的运营结算,因此,国内大部分城市乘坐公交车只需上车时刷卡一次,即 一票制,这样IC卡信息里就不包括上下车站点信息及下车时间信息。而公交客流信息中最 重要的就是客流在时间、空间上的分布信息,因此,如此何处理一票制IC卡数据以获得乘 客在某一时间的上车站点(也就是获得客流在时间、空间上的分布信息)就成为公交IC卡 数据的关键。现有的处理一票制IC卡数据获得上车站点的技术方案有如下两种方案1、GPS与 IC卡数据融合处理;方案2、行车路单与IC卡数据整合处理。方案1很简单,国内的一些 城市,如广州、杭州等,公交车上安装有GPS定位系统,借助于公交车GPS数据,可以获取公 交车到达每一站的时间,与刷卡时间进行对比,从而推算出每一条刷卡记录的上车站,并获 取公交客流信息。然而,方案1需要较好的数据基础,而现在数据比较难获取,相对成本较 高,在现在条件下并不是每辆公交车都安装有GPS定位,现在安有定位系统的公交车占少 数,因此可实施性较弱,另外安装GPS定位,使用和维护成本都相对较高。方案2就无需在 每辆公交车上安装GPS定位系统,而仅需要对始末站进行行车计时,根据出发时间与到达 终点站时间,再根据站距以及公交行车速度,大致估计车辆到达每个车站的时间,与IC卡 数据的刷卡进行对比,便可判断出上车站点。但方案2具有下述缺陷首先行车路单记录始 末站时间不一定准确,其次公交车在路上行驶根据路况不同,行驶速度就不同,到达时间的 推算固然也不准确,因此这种方案的准确性太低。有鉴于上述现有的处理一票制IC卡数据的技术方案存在的缺陷,本专利技术人基于 从事此研究多年丰富的实务经验及专业知识,并配合学理的运用,积极加以研究创新,以期 创设一种新的基于一票制公交IC卡数据推算上车站点的方法,能够改进一般现有的处理 一票制IC卡数据的技术,使其更具有实用性。
技术实现思路
为了解决现有技术中存在的上述问题,本专利技术提供了一种基于一票制公交IC卡数据推算上车站点的方法。本专利技术方法可以有效地处理一票制IC卡数据,从而获得乘客上 车站点信息。本专利技术方法对数据要求低,且精度较高。为了解决上述技术问题,本专利技术采用了如下技术方案基于一票制公交IC卡数据推算上车站点的方法,包括如下步骤a.根据刷卡记录的时间将目标公交车的刷卡记录进行聚类,刷卡时间相近的刷卡 记录为一个聚类,每个聚类对应一个站点,形成待识别聚类序列;b.调取每张IC卡的相邻的前一刷卡记录和后一刷卡记录,将前一刷卡记录和后 一刷卡记录与目标公交车的刷卡记录相关联,确定前一刷卡记录或后一刷卡记录与目标 公交车的刷卡记录之间是否形成换乘信息;C.根据换乘信息以及公交线路之间的交叉点数据信息,以及公交线路的站点信 息,推算出形成换乘信息的IC卡所在待识别聚类对应的实际站点,形成已识别聚类序列;d.根据已识别聚类序列推算待识别聚类对应的实际站点,当已识别聚类数量小于 2时,用移动步距的贝叶斯决策树法推算待识别聚类对应的实际站点;当已识别聚类数量 大于等于2,采用模式识别的方法推算待识别聚类对应的实际站点。进一步,所述移动步距的贝叶斯决策树法为每个待识别聚类都有若干个候选站 点,从该待识别聚类的上一个已识别聚类所对应的实际站点到该待识别聚类的各个候选站 点形成了一个同根的树状结构,通过线路特征和站点特征对候选站点进行相似度判定,计 算待识别聚类与候选站点的隶属度,根据公式权利要求1.基于一票制公交IC卡数据推算上车站点的方法,其特征在于,包括如下步骤a.根据刷卡记录的时间将目标公交车的刷卡记录进行聚类,刷卡时间相近的刷卡记录 为一个聚类,每个聚类对应一个站点,形成待识别聚类序列;b.调取每张IC卡的相邻的前一刷卡记录和后一刷卡记录,将前一刷卡记录和后一刷 卡记录与目标公交车的刷卡记录相关联,确定前一刷卡记录或后一刷卡记录与目标公交车 的刷卡记录之间是否形成换乘信息;c.根据换乘信息以及公交线路之间的交叉点数据信息,以及公交线路的站点信息,推 算出形成换乘信息的IC卡所在待识别聚类对应的实际站点,形成已识别聚类序列;d.根据已识别聚类序列推算待识别聚类对应的实际站点,当已识别聚类数量小于2 时,用移动步距的贝叶斯决策树法推算待识别聚类对应的实际站点;当已识别聚类数量大 于等于2,采用模式识别的方法推算待识别聚类对应的实际站点。2.根据权利要求1所述的基于一票制公交IC卡数据推算上车站点的方法,其特征在 于,所述移动步距的贝叶斯决策树法为每个待识别聚类都有若干个候选站点,从该待识别 聚类的上一个已识别聚类所对应的实际站点到该待识别聚类的各个候选站点形成了一个 同根的树状结构,通过线路特征和站点特征对候选站点进行相似度判定,计算待识别聚类 与候选站点的隶属度,根据公式Pi = Σ Pi OO Vj = I式中Pi (j)__第j层第i片叶子的隶属度(叶子是指树最外层部分);Pi-从树根到第i片树叶的几何平均概率计算从树根到第i片树叶的几何平均概率,概率最大的树叶及其连接到树根的枝就是 待识别聚类所对应的实际站点序列。3.根据权利要求2所述的基于一票制公交IC卡数据推算上车站点的方法,其特征在 于,待识别聚类与候选站点的隶属度计算包括如下步骤1、由线路特征可以得到上一已识 别聚类对应的实际站点到待识别聚类k对应的候选站点间的距离d ;2、根据待识别聚类k 的刷卡时间、数量和持续时间得到上一已识别聚类对应的实际站点到待识别聚类k的旅行 时间t ;3、根据距离d和旅行时间t,通过公式spd = d/t计算上一已识别聚类对应的实际 站点与待识别聚类k对应的候选站点之间的速度spd ;4、由速度特征得到的上一已识别聚 类对应的实际站点与待识别聚类对应的候选站点的平均速度μ以及速度标准差ο,根据 标准正态分布密度拟合函数/(_〕=irxp(— 〕,并根据公式_=,得到待识别聚类与候选站点间的相似度,即隶属度。4.根据权利要求3所述的基于一票制公交IC卡数据推算上车站点的方法,其特征在 于,待识别聚类与候选站点的隶属度计算还包括如下步骤通过站点特征调取待识别聚类 对应的候选站点的已知的实际刷卡量级别,并与待识别聚类的刷卡量级别进行对比分析, 得出站点特征判定分数,将站点特征判定分数与第4步由速度特征得到的隶属度相结合, 得出待识别聚类与候选站点的隶属度的综合判定分数。5.根据权利要求1所述的基于一票制公交IC卡数据推算上车站点的方法,其特征在于,所述模式本文档来自技高网
...

【技术保护点】
基于一票制公交IC卡数据推算上车站点的方法,其特征在于,包括如下步骤:a.根据刷卡记录的时间将目标公交车的刷卡记录进行聚类,刷卡时间相近的刷卡记录为一个聚类,每个聚类对应一个站点,形成待识别聚类序列;b.调取每张IC卡的相邻的前一刷卡记录和后一刷卡记录,将前一刷卡记录和后一刷卡记录与目标公交车的刷卡记录相关联,确定前一刷卡记录或后一刷卡记录与目标公交车的刷卡记录之间是否形成换乘信息;c.根据换乘信息以及公交线路之间的交叉点数据信息,以及公交线路的站点信息,推算出形成换乘信息的IC卡所在待识别聚类对应的实际站点,形成已识别聚类序列;d.根据已识别聚类序列推算待识别聚类对应的实际站点,当已识别聚类数量小于2时,用移动步距的贝叶斯决策树法推算待识别聚类对应的实际站点;当已识别聚类数量大于等于2,采用模式识别的方法推算待识别聚类对应的实际站点。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈锋温慧敏郭继孚王印海刘剑锋
申请(专利权)人:北京交通发展研究中心
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1