【技术实现步骤摘要】
一种基于出行链与集成学习的公交乘客下车站点推断方法
[0001]本专利技术涉及公共交通数据处理与分析领域,尤其是涉及一种基于出行链与集成学习两阶段模型的公交乘客下车站点推断方法。
技术介绍
[0002]发展智慧公交是现代城市交通发展的主要方向之一,对于提升公交系统服务水平、实现公交优先战略目标、促进城市交通可持续发展具有重要意义。在智慧公交系统中,公交客流特征分析可以为服务设计、运营管理、服务评估等应用场景提供需求数据基础,是整个系统的关键环节。公交客流特征分析的数据基础主要为以公交IC卡、二维码为代表的自动收费系统(Automatic Fare Collection,AFC),按照乘客刷卡(码)交易的方式可分为开放式和封闭式两类:前者乘客仅在上车时刷卡(码),系统仅记录乘客的上车记录,常用于单一票制的公交系统;后者乘客在上车和下车时均需刷卡(码)以完成交易,系统同时记录乘客的上下车记录,常用于分段计费的公交系统。由于系统成本、乘车效率等因素,目前仍有大量公交系统采用开放式AFC系统,无法直接从交易数据中获取乘客的下车信息。 ...
【技术保护点】
【技术特征摘要】
1.一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,包括如下步骤:采集公交乘客下车站点推断基础数据,包括公交AFC系统交易数据、公交车辆GPS数据与线路站点GIS数据;对下车站点推断基础数据进行清洗与预处理;融合交易数据与车辆GPS数据,匹配公交乘客上车站点;基于出行链假设与公交乘客出行历史,构建基于规则的确定性算法,进行第一阶段的公交乘客下车站点推断;构建基于集成学习两层堆叠框架的多分类模型,对确定性算法无法推断的行程进行第二阶段的公交乘客下车站点推断,综合两阶段模型输出获得公交乘客下车站点推断的最终结果。2.根据权利要求1所述的一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,所述采集推断基础数据具体包括:采集公交交易数据,包括上车时间、交易POS机号码、交易卡号及交易金额;采集公交车辆GPS数据,包括时刻、经度、纬度及瞬时车速字段;采集公交线路及站点GIS数据,其中线路GIS数据包括线路名、线路方向、站序及站点名称,站点GIS数据包括站点名、经度及纬度;采集行车路单与车载POS机
‑
车辆匹配表数据,其中行车路单为车辆运营信息表,每一张行车路单记录一辆车在一天的所有班次,包括每一个班次的起讫站和出发到达时间;车载POS机
‑
车辆匹配表记录了车载POS机和公交车辆的匹配关系,包括车牌号、线路名、车载POS机号和车辆自编号。3.根据权利要求2所述的一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,所述数据清洗与预处理具体步骤包括:根据行车路单记录的班次到发时间,将公交车辆GPS数据划分到对应的班次;根据预设的距离与时间阈值,识别并剔除公交车辆GPS数据中包括大规模漂移和重复的异常GPS轨迹点,对GPS轨迹进行线性插值补齐;根据车载POS机
‑
车辆匹配表将公交交易数据匹配到对应车辆,再根据行车路单将已匹配到车辆的交易数据匹配到对应线路和班次。4.根据权利要求1所述的一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,所述公交乘客上车站点匹配具体步骤包括:基于公交站点GIS数据,对每条公交线路的每个方向,计算各站点到相应起点站的累计距离;对每条公交线路、每个方向的各站点,分别规定站点前、后指定距离阈值Δd的位置为车辆在该中间站的进站位置与出站位置;对于起点站,仅规定站点后的出站位置,终点站不规定进、出站位置;将划分好班次的车辆GPS轨迹点按照距离就近原则匹配到地图的路段,并根据路段匹配结果计算每个轨迹点到起点站的累计距离;根据GPS轨迹点到起点站的累计距离,找到每一班次车辆到达各中间站点进站位置与出站位置的时间,分别规定为班次在该中间站的进站时间与出站时间,进站时间与出站时
间之间的间隔规定为该班次在该中间站的到站时间窗;遍历每条公交交易记录,对于中间站,若交易时间落在该站点对应线路、方向与班次的到站时间窗内,则判断该交易记录的上车站点为该中间站;若交易时间落在该班次起点站的出站时间之前,则判断该交易记录的上车站点为起点站。5.根据权利要求1所述的一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,基于所述规则的确定性算法推断下车站点的具体步骤包括:基于交易数据采用出行链假设推断下车站点,所述出行链假设包括:连续出行假设、当日对称出行假设以及归家出行假设;若交易记录不适用任何一条出行链假设,则基于对应乘客的出行历史推断下车站点;若基于对应乘客出行历史仍无法推断得到下车站点,则该交易记录为确定性算法无法推断的行程。6.根据权利要求5所述的一种基于出行链与集成学习的公交乘客下车站点推断方法,其特征在于,所述基于交易记录采用出行链假设推断下车站点,具体步骤包括:步骤1:从公交交易数据中取出一条交易记录T
i
,获取该记录中乘客乘坐的线路,方向,上车站点,上车时间;判断该记录是否为交易卡号对应乘客一天中的最后一次出行,若是则进入步骤4,否则进入步骤2;步骤2:读取该乘客当天下一次出行的交易记录T
i+1
,获得下一次出行的上车站点s
i+1
,查找交易记录在线路、方向的后续站点中与下一次出行的上车站点s
i+1
距离最小的站点s
n
;步骤3:计算站点s
n
与s
i+1
的步行距离d1,判断d1是否小于等于预设阈值d
max1
,若是则推断当前交易记录T
i
的下车站点为s
i
,否则进行基于对应乘客出行历史的下车站点推断;步骤4:判断当前交易记录T
i
是否为该乘客一天中的第一次出行,若是即该记录是该乘客一天中的唯一一次出行,则进入步骤7,否则进入步骤5;步骤5:读取该...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。