当前位置: 首页 > 专利查询>同济大学专利>正文

一种公交乘客客流数据采集与分析方法技术

技术编号:14349947 阅读:249 留言:0更新日期:2017-01-04 20:40
本发明专利技术提出了一种公交乘客客流数据采集与分析方法,包括以下步骤:追踪用户在公交无线网络接入点的出现时刻与消失时刻;将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻;判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;前述得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,对前述得到的客流进行修正。该方法操作简单、涉及数据量大,能够有效排除跟车干扰,准确性高且适应范围广。

【技术实现步骤摘要】

本专利技术属于道路交通信息服务与运营管理领域,涉及一种数据采集与分析方法,尤其是一种乘客客流数据采集与分析方法。
技术介绍
目前,公交公司、交通管理部门所需的乘客站点上下客与站间断面客流信息的主要数据来源有人工抽样、交通IC卡以及车门视频数据。其中,人工抽样具有高精准度、人力成本大、样本过小的特点;交通IC卡则具有用户多、数据量大、使用频率高等特点,但由于大量公交只需上车刷卡,导致IC卡无法准确获知乘客的下车站点;视频数据能够较准确地识别各车门的上下客人数,但人流高峰时识别精度会明显下降,且无法获知乘客的出行OD(起讫点)。公开号为CN105096601A的中国专利申请“基于公交移动WiFi热点的线路满载率实时计算方法”中,根据公交车牌ID数据提取对应该公交车牌ID的链接WiFi的实时手机用户数目,从而计算单个公交车车辆上的实际乘客总数,结合承载定员人数计算单个公交车车辆满载率。该方法通过满载率来判断线路设计合理性,最终达到公交车辆分配调度的最优化平衡目的。公开号为CN103700174A的中国专利申请“一种基于WiFi身份识别的公交客流数据采集及OD分析方法”中,通过公交AP热点读取乘客所持有WiFi设备的MAC地址,识别乘客身份再通过对列表中MAC地址的统计获取公交车上下车及断面持有WiFi乘客总人数。该方法建立乘客信息数据库,得到整个城市所有公交站点之间的OD矩阵。但上述技术都没有考虑公交车,包括小汽车、公交车等临近车辆的干扰,同时城区与郊区的道路交通流存在很大差异,不同的公交上下客流也存在不同分布的误差,具体的修正或扩样方法不可一概而论。专利技术内容本专利技术的目的在于提供一种能够极大地排除干扰,有效修正的公交乘客客流数据采集与分析方法。为了达到上述目的,本专利技术的解决方案是:一种公交乘客客流数据采集与分析方法,包括以下步骤:(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te;(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。所述步骤(1)基于IEEE802.11的通信机制,用户的移动终端通过WIFI方式传输信息帧,公交车AP终端对用户的移动终端进行无认证感知并采集,记录用户信息,并进行帧类型的识别。优选地,所述用户信息包括用户MAC地址、信息传输时间、信息帧类型和信号强度。所述步骤(2)中将公交车GPS数据与站点信息进行匹配的方法为:(21)查询目标线路每个站点的经纬度坐标;(22)换算每条GPS数据记录的经纬度坐标与每个站点的经纬度坐标换对应位置的距离djw;每条GPS数据均至少包括记录时刻、在所述记录时刻公交车所处的经纬度坐标以及公交车的速度;(23)筛选出每个站点半径阈值dr范围内的所有GPS数据,从中筛选出公交车的速度最小且最小的速度小于速度阈值的记录点作为公交车在该站点的停车点,记录停靠时刻tb;半径阈值dr和所述速度阈值均为设定的;(24)将各站点的站点名称、站点的经纬度坐标、对应的停车点处的经纬度坐标、站点和对应的停车点的距离、对应的最小的公交车的速度构成匹配结果。优选地,所述距离djw的计算公式为:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180其中:LonA和LatA为站点的经纬度坐标;LonB和LatB为GPS记录点的经纬度坐标;R为地球半径;Mlon表示对东经取正,对西经取负后得到的新经度。优选地,所述速度阈值为10km/h。所述步骤(3)中的时间阈值Δt的计算方法为:根据上一部公交车GPS数据与站点信息匹配的结果,计算所在线路各站点之间公交车的行驶时间集合TI;再提取所述行驶时间集合TI的85%分位数tI85,把大于tI85的行驶时间剔除,保留剩余的行驶时间得到行驶时间集合TI’,并求得TI’的均值则时间阈值Δt根据下式计算得到:所述步骤(3)中的距离阈值Δs为:Δs=db2其中,db2为若乘客下车后往与公交车的行驶方向相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站点的距离。所述步骤(3)包括以下步骤:(31)对每个用户,计算消失时刻te与出现时刻ts之差得到持续时间Tse;(32)若持续时间Tse小于时间阈值Δt,则认定对应的用户不是公交车乘客,直接删除对应的用户的数据;否则,进入步骤(33);(33)在公交车GPS数据中,寻找在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;(34)基于所述步骤(2)匹配得到的公交车在各站点的停靠信息,将离出现时刻ts公交车的经纬度坐标最近的同方向的站点设定为用户的上车站点,将离消失时刻te公交车的经纬度坐标最近的同方向的站点设定为用户的下车站点;(35)计算出现时刻ts公交车的经纬度坐标与设定的上车站点之间的距离d1,以及消失时刻te公交车的经纬度坐标与设定的下车站点之间的距离d2;当所述距离d1和所述距离d2均小于所述距离阈值Δs时,判定对应的用户为公交车乘客,所述步骤(34)中设定的上车站点和下车站点为用户实际的上车站点和下车站点。所述步骤(5)中对客流误差进行假设检验和修正包括:假设客流误差服从正态分布,对样本进行参数估计,拟合得到客流误差的正态分布,称为拟合正态分布;通过正态假设检验判断所述拟合正态分布的合理性;将通过检验的拟合正态分布的期望值作为客流的修正值,将所述修正值加上所述步骤(4)推断得到的客流,得到修正后的客流。优选的,所述拟合采用MATLAB软件进行。所述检验的方法为利用T检验进行显著性水平为0.05的假设检验。所述检验的方法为皮尔逊卡方检验。优选地,所述检验的方法包括以下步骤:将需要检验的数据分为等量的m组;依次计算以下各式:pi=φ(Xmax-μα)]]>npi=Xmax*piχ2=Σi=0m(ni-npi)2npi]]>其中:pi为正态概率;npi为理论频数;n表示所用于检验的样本量;Xmax表示分成m组中,每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值;如果算得的χ2趋向于自由度为l-k-1的χ2分布,则假设检验成立,样本数据符合假设的正态分布;如果算得的χ2大于自由度为l-k-1的χ2分本文档来自技高网...
一种公交乘客客流数据采集与分析方法

【技术保护点】
一种公交乘客客流数据采集与分析方法,其特征在于:包括以下步骤:(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te;(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。

【技术特征摘要】
1.一种公交乘客客流数据采集与分析方法,其特征在于:包括以下步骤:(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te;(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。2.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(1)基于IEEE802.11的通信机制,用户的移动终端通过WIFI方式传输信息帧,公交车AP终端对用户的移动终端进行无认证感知并采集,记录用户信息,并进行帧类型的识别;优选地,所述用户信息包括用户MAC地址、信息传输时间、信息帧类型和信号强度。3.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(2)中将公交车GPS数据与站点信息进行匹配的方法为:(21)查询目标线路每个站点的经纬度坐标;(22)换算每条GPS数据记录的经纬度坐标与每个站点的经纬度坐标换对应位置的距离djw;每条GPS数据均至少包括记录时刻、在所述记录时刻公交车所处的经纬度坐标以及公交车的速度;(23)筛选出每个站点半径阈值dr范围内的所有GPS数据,从中筛选出公交车的速度最小且最小的速度小于速度阈值的记录点作为公交车在该站点的停车点,记录停靠时刻tb;半径阈值dr和所述速度阈值均为设定的;(24)将各站点的站点名称、站点的经纬度坐标、对应的停车点处的经纬度坐标、站点和对应的停车点的距离、对应的最小的公交车的速度构成匹配结果;优选地,所述距离djw的计算公式为:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180其中:LonA和LatA为站点的经纬度坐标;LonB和LatB为GPS记录点的经纬度坐标;R为地球半径;Mlon表示对东经取正,对西经取负后得到的新经度;优选地,所述速度阈值为10km/h。4.根据权利要求1所述的公交乘客客流数据采集与分析方法,其特征在于:所述步骤(3)中的时间阈值Δt的计算方法为:根据上一部公交车GPS数据与站点信息匹配的结果,计算所在线路各站点之间公交车的行驶时间集合TI;再提取所述行驶时间集合TI的85%分位数tI85,把大于tI85的行驶时间剔除,保留剩余的行驶时间得到行驶时间集合TI’,并求得TI’的均值则时间阈值Δt根据下式计算得到:5.根据权利要求1所述的...

【专利技术属性】
技术研发人员:施莉娟欧冬秀李玮唐茂杰闫黄陈丽璇阳扬
申请(专利权)人:同济大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1