基于多模式公交数据匹配的公共交通出行特征提取方法技术

技术编号:11697190 阅读:232 留言:0更新日期:2015-07-08 19:26
本发明专利技术涉及一种基于多模式公交数据匹配的公共交通出行特征提取方法,引入了公共交通通勤出行链的概念,利用地面公交、轨道交通和公共自行车刷卡数据,公交GPS数据,公共交通站点、线路基础数据等多源数据,通过数据预处理与匹配、公共交通出行链结构提取、通勤出行行为判别、出行阶段起讫点确定和出行特征信息匹配五个步骤,来获取居民通勤出行特征信息,如通勤出行时间、通勤出行距离和换乘特性等。本发明专利技术有助于公共交通运营企业和政府主管部门准确掌握居民通勤出行状况,为城市公共交通线网优化、公共交通政策的制定等提供支持,对提高居民通勤出行效率有重要意义。

【技术实现步骤摘要】

本专利技术属于公共交通运行监测领域,涉及一种基于多模式公交数据匹配的公共交 通出行特征计算与分析方法。
技术介绍
通勤出行是公共交通服务的主体,掌握其出行特征是合理投放公共交通运力、制 定公共交通线网优化措施的基础。随着智能化公共交通系统的推广,公共交通多源数据 (如IC卡数据、公交GPS数据等)被广泛采集,这些数据记录了居民的公共交通出行过程, 为提取其出行特征奠定了良好的数据基础。申请号为CN201210074506的专利公开了一种 基于手机定位数据的居民出行特征参数的获取方法,将手机数据与交通小区匹配,并把连 续的数据进行合并,根据合并的数目及影响时长还原用户的出行路径,得到出行距离、出行 速度。但是该专利公开的居民出行特征参数的获取方法,无法准确识别用户的类别,即不能 准确区分通勤与非通勤用户,且根据修正后的手机定位数据直接计算出行距离等参数,会 导致计算误差偏大。申请号为CN200910190637的专利公开了一种基于多源数据融合的人 口时空动态出行特征建模方法,将地图数据、手机定位数据和浮动车辆数据融合,建立人口 出行特征空间分析模型,获得人口分布和人口出行特征分布。但是该专利公开的人口时空 动态出行特征建模方法,并非居民使用公共交通工具的出行特征,且所得到的人口出行特 征是宏观层面的,达不到具体用户在某出行阶段的出行特征的精度。 国内大部分的大中城市的公共交通均包括地面公交、轨道交通和公共自行车三种 方式,而地面公交通常又包括单一票制公交和分段计价公交两种类型。如何有效地关联匹 配这些海量异构数据,挖掘公共交通通勤出行特征,目前还缺乏一套完整的方法体系。
技术实现思路
本专利技术提出了 "公共交通出行链"的概念,并引入"出行阶段"以实现对公共交通 出行过程的细化表达。本专利技术在多源数据关联匹配的基础上,提出了通过出行链结构提取、 通勤出行判别、出行阶段起讫点确定和出行特征信息匹配等步骤,获取居民公共交通通勤 出行特征的完整方法。 ,包括以下步骤: 步骤1 :公共交通多源数据预处理与匹配。 筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关 联匹配。 步骤1. 1 :公共交通刷卡数据预处理。 地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公 交又分为一票制公交和分段计价公交两类。需根据各类刷卡数据字段的含义,从中提取居 民出行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中。 为区分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为"B1",分 段计价地面公交标记为"B2",轨道交通标记为"R",公共自行车标记为"Z"。整合之后的刷 卡数据表的字段如表1所示,信息不全的字段,暂置为空。 表1公共交通刷卡数据整合表字段【主权项】1.,其特征在于:所述方法包 括以下步骤: 步骤1 :公共交通多源数据预处理与匹配; 步骤2 :公共交通出行链结构提取; 步骤3:通勤出行行为判别; 步骤4 :出行阶段起讫点确定; 步骤5 :出行特征信息匹配; 所述步骤1公共交通多源数据预处理与匹配的方法如下, 筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关联匹 配; (1) 公共交通刷卡数据预处理; 地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公交又 分为一票制公交和分段计价公交两类;需根据各类刷卡数据字段的含义,从中提取居民出 行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中;为区 分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为"B1",分段计 价地面公交标记为"B2",轨道交通标记为"R",公共自行车标记为"Z" ;整合之后的刷卡数 据表的字段如表1所示,信息不全的字段,暂置为空; 表1公共交通刷卡数据整合表字段(2) 基于公交GPS数据的公交到站时间确定; 基于公交GPS定位数据和公交线路基础数据,通过地图匹配、弧段弥补、站点匹配、行 驶方向判别等步骤,获取公交车辆的到达站点的时间; (3) 多模式公共交通站点空间关系匹配; 由于轨道交通和公共自行车刷卡数据记录了出行起讫点的信息,而地面公交刷卡数据 中记录的出行起讫点信息不全,部分上下车站点信息需通过换乘过程去推断;因此,利用 地面公交、轨道交通和公共自行车的站点坐标数据,建立了三类公共交通站点的空间关系 表,以此来确定居民的换乘过程信息;根据不同类型站点的辐射能力不同,确定的地面公 交站点吸引范围为360m,轨道交通站点的吸引范围为770m,公共自行车站点的吸引范围为 300m ;在各类站点相应的吸引范围阈值内,加之出行的乘车线路等信息,根据换乘距离最短 原则,确定换乘过程的上下车站点;公共交通站点空间关系表字段如下所示: 表2公共交通站点空间关系表(4) 轨道交通任意站点间行程距离确定; 居民在轨道交通内部换乘不需刷卡,这对获取乘客出行路径造成了困难;基于居民出 行会选择时间最短方案的假设,通过最短路径搜索,确定已知轨道交通站点OD对之间的最 优路径,再根据轨道交通基础数据中任意相邻站点间距离数据,计算得到轨道交通站点任 意OD对之间的行程距离; 所述步骤2公共交通出行链结构提取的方法如下, 公共交通出行链是指从出行起始站点到目的站点,由一个或多个公共交通出行阶段按 发生顺序组成的一次完整出行过程;公共交通出行链属于不闭合的单链,可再现出行者每 一次公共交通出行的微观过程;出行者一天可出现一条或多条公共交通出行链,一条公共 交通出行链可包含一个或多个出行阶段; 根据同一用户相邻两条刷卡记录的交易时间差,判断此相邻的两个出行阶段是属于换 乘关系还是分属两条不同的出行链,据此对出行者的各出行阶段进行连接或划分,确定出 行链的基本结构; 由于地面公交、轨道交通和公共自行车三类刷卡数据中所记录的交易时间含义不同: 一票制公交(BI)记录了上车时间、分段计价公交(B2)记录了下车时间、轨道交通(R)记录 了进站和出站时间、公共自行车(Z)记录了借车和还车时间,因此三类出行方式之间存在 14种换乘类型,而每种换乘类型的交易时间差中包含了不同的时间组成部分,如不同交通 方式的在途时间、不同换乘过程的换乘时间等,因此每种换乘类型的交易时间差阈值各不 相同;14种换乘类型的交易时间差组成及阈值如表3所示: 表3相邻出行阶段换乘时间阈值根据上表中的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为 此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的 出行链; 所述步骤3通勤出行行为判别的方法如下: 由于刷卡数据中包含了各种不同出行目的的刷卡记录,因此,需要制定规则筛选出以 通勤为目的的出行行为; 所述步骤4出行阶段起讫点确定的方法如下, 使用轨道交通或公共自行车方式的出行阶段,可根据其刷卡数据中记录的站点编号, 加之轨道交通和公共自行车站点的基当前第1页1 2 本文档来自技高网
...

【技术保护点】
基于多模式公交数据匹配的公共交通出行特征提取方法,其特征在于:所述方法包括以下步骤:步骤1:公共交通多源数据预处理与匹配;步骤2:公共交通出行链结构提取;步骤3:通勤出行行为判别;步骤4:出行阶段起讫点确定;步骤5:出行特征信息匹配;所述步骤1公共交通多源数据预处理与匹配的方法如下,筛选海量数据中的有效数据,改善数据质量,并利用相关字段进行数据整合与关联匹配;(1)公共交通刷卡数据预处理;地面公交、轨道交通和公共自行车三类方式的刷卡数据字段互不相同,而地面公交又分为一票制公交和分段计价公交两类;需根据各类刷卡数据字段的含义,从中提取居民出行相关的用户卡号、交易时间、乘车线路、站点编号等字段,并整合到同一个数据表中;为区分不同刷卡类型,给每类刷卡数据添加唯一的标记:一票制地面公交标记为“B1”,分段计价地面公交标记为“B2”,轨道交通标记为“R”,公共自行车标记为“Z”;整合之后的刷卡数据表的字段如表1所示,信息不全的字段,暂置为空;表1 公共交通刷卡数据整合表字段(2)基于公交GPS数据的公交到站时间确定;基于公交GPS定位数据和公交线路基础数据,通过地图匹配、弧段弥补、站点匹配、行驶方向判别等步骤,获取公交车辆的到达站点的时间;(3)多模式公共交通站点空间关系匹配;由于轨道交通和公共自行车刷卡数据记录了出行起讫点的信息,而地面公交刷卡数据中记录的出行起讫点信息不全,部分上下车站点信息需通过换乘过程去推断;因此,利用地面公交、轨道交通和公共自行车的站点坐标数据,建立了三类公共交通站点的空间关系表,以此来确定居民的换乘过程信息;根据不同类型站点的辐射能力不同,确定的地面公交站点吸引范围为360m,轨道交通站点的吸引范围为770m,公共自行车站点的吸引范围为300m;在各类站点相应的吸引范围阈值内,加之出行的乘车线路等信息,根据换乘距离最短原则,确定换乘过程的上下车站点;公共交通站点空间关系表字段如下所示:表2 公共交通站点空间关系表(4)轨道交通任意站点间行程距离确定;居民在轨道交通内部换乘不需刷卡,这对获取乘客出行路径造成了困难;基于居民出行会选择时间最短方案的假设,通过最短路径搜索,确定已知轨道交通站点OD对之间的最优路径,再根据轨道交通基础数据中任意相邻站点间距离数据,计算得到轨道交通站点任意OD对之间的行程距离;所述步骤2公共交通出行链结构提取的方法如下,公共交通出行链是指从出行起始站点到目的站点,由一个或多个公共交通出行阶段按发生顺序组成的一次完整出行过程;公共交通出行链属于不闭合的单链,可再现出行者每一次公共交通出行的微观过程;出行者一天可出现一条或多条公共交通出行链,一条公共交通出行链可包含一个或多个出行阶段;根据同一用户相邻两条刷卡记录的交易时间差,判断此相邻的两个出行阶段是属于换乘关系还是分属两条不同的出行链,据此对出行者的各出行阶段进行连接或划分,确定出行链的基本结构;由于地面公交、轨道交通和公共自行车三类刷卡数据中所记录的交易时间含义不同:一票制公交(B1)记录了上车时间、分段计价公交(B2)记录了下车时间、轨道交通(R)记录了进站和出站时间、公共自行车(Z)记录了借车和还车时间,因此三类出行方式之间存在14种换乘类型,而每种换乘类型的交易时间差中包含了不同的时间组成部分,如不同交通方式的在途时间、不同换乘过程的换乘时间等,因此每种换乘类型的交易时间差阈值各不相同;14种换乘类型的交易时间差组成及阈值如表3所示:表3 相邻出行阶段换乘时间阈值根据上表中的交易时间差阈值,若相邻两个出行阶段的交易时间在阈值以内,则认为此两个出行阶段之间存在换乘行为,两者属于同一出行链;反之,则认为两者分属于不同的出行链;所述步骤3通勤出行行为判别的方法如下:由于刷卡数据中包含了各种不同出行目的的刷卡记录,因此,需要制定规则筛选出以通勤为目的的出行行为;所述步骤4出行阶段起讫点确定的方法如下,使用轨道交通或公共自行车方式的出行阶段,可根据其刷卡数据中记录的站点编号,加之轨道交通和公共自行车站点的基础信息,两者匹配可获得其完整的进站站点名称和出站站点名称;而地面公交刷卡数据记录的上下车站点信息不完整,要获取地面公交方式的出行阶段的起讫点,需经过以下三个步骤的匹配:(1)基于公交到站时间的公交上车或下车站点匹配;一票制公交的刷卡数据记录了乘客上车时间,分段计价公交的刷卡数据记录了乘客的下车时间,两者与乘客所在公交车辆的到站时间表匹配,可得到一票制公交乘客的上车站点名称以及分段计价公交乘客的下车站点名称;但是,刷卡数据记录的是IC卡系统的时间,而公交车辆到站时间记录的是公交GPS系统的时间,两者存在一定的偏差;并且考虑到乘客下车会提前刷卡、大量乘客排队上车时刷卡过程持续时间长等因素的影响,需要在站点匹配时设置合理的阈值,以保证匹配的成...

【技术特征摘要】

【专利技术属性】
技术研发人员:翁剑成张乐典陈智宏王月玥王昌荣建
申请(专利权)人:北京工业大学北京市交通运行监测调度中心
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1