The invention discloses a general recognition method based on the data of the subway card, which comprises the following steps: 1) the subway card based on information collection, including IC card number and card station time and data pretreatment; 2) to find the highest frequency of use and the station corresponding to the highest frequency of use for each station number, as the home station and the station station Candidate School; 3) according to the school schedule of the city arrangement, between two candidate number of each station stop time travel records according to the classification, and according to certain rules to determine the home school between station and station; 4) card and records to find out and remove non commuting travel records and difficult to judge. The present invention starting from the perspective of time and space, the integration of processing large amounts of data for the first time the subway card, subway card data recognition method is proposed based on the general population, solve the problem of the use of large data research school behavior, overcomes the shortcoming of the traditional methods of investigation.
【技术实现步骤摘要】
一种基于地铁刷卡数据的通学识别方法
本专利技术涉及交通规划中出行行为数据采集与分析方法,具体涉及一种基于地铁刷卡数据的通学识别方法。
技术介绍
近年来,学生出行方式的选择引起了越来越多的学者的关注。在中国,小学和初中阶段的学生应该根据就近入学的政策入学。但是,由于教育资源分配不均衡,越来越多的家长会通过择校为他们的孩子获取高质量的教育资源,这通常会导致一个长距离的通学距离。地铁作为城市主要的中长距离出行模式会被他们选择。然而,这些会使用地铁的学生日常仍然会被父母开车接送去学校。为了引导这些学生更多的使用地铁,有必要更好地了解他们日常的通学模式。通学行为即与通勤行为对应的从家中往返学校的过程,目前均采用传统问卷调查方法获得通学出行的信息来进行分析,传统的问卷调查方法调查过程耗费大量人力和时间,调查样本量少且样本覆盖范围小、不全面,导致分析结果有偏差或者只能对范围有限的局部地区进行分析。而且,通学行为是一个长期的过程,难以通过短期的传统调查来获取完整的数据。幸运的是为收费设计的地铁智能卡系统可以提供详细的刷卡记录,包括可用于许多目的的卡类型、刷卡日期和地铁站点,这些数据可以更好地代替许多传统调查方式获取的数据。但是,尽管基于智能卡数据的通勤识别研究方法日渐成熟,目前对学校通学行为识别的研究却极少。常规通勤识别方法关注的是时间和空间模式,根据一周内的乘车频次、固定的上下车站、两次乘车的时间间隔等来识别人群的通勤出行。而在通学行为识别方法中,由于家长开车接送学生上下学的现象十分普遍,因此长期使用地铁的中小学生人数并不是非常多,如果仅仅依靠出行频率将会错误地排除掉大 ...
【技术保护点】
一种基于地铁刷卡数据的通学识别方法,其特征在于,该方法包括以下步骤:(1)采集一定时间段内各地铁站点的IC卡刷卡数据和地铁站点坐标数据,对原始刷卡数据进行预处理,剔除无效数据;(2)为每个卡号计算出该卡号所有车站的出现频次,找出其中出现频次最高的车站,并统计每个卡号的出现频次最高的车站的数量;(3)根据出现频次最高的车站的数量,找出每个卡号的家车站和学校车站的候选车站;(4)根据中小学作息时间安排,将所有卡号候选车站之间的出行记录按照进站时间分为若干类别;(5)针对落入各个类别中的出行记录,根据最早或最晚进站时间确定家车站和学校车站,从而得到通学出行记录。
【技术特征摘要】
1.一种基于地铁刷卡数据的通学识别方法,其特征在于,该方法包括以下步骤:(1)采集一定时间段内各地铁站点的IC卡刷卡数据和地铁站点坐标数据,对原始刷卡数据进行预处理,剔除无效数据;(2)为每个卡号计算出该卡号所有车站的出现频次,找出其中出现频次最高的车站,并统计每个卡号的出现频次最高的车站的数量;(3)根据出现频次最高的车站的数量,找出每个卡号的家车站和学校车站的候选车站;(4)根据中小学作息时间安排,将所有卡号候选车站之间的出行记录按照进站时间分为若干类别;(5)针对落入各个类别中的出行记录,根据最早或最晚进站时间确定家车站和学校车站,从而得到通学出行记录。2.根据权利要求1所述的一种基于地铁刷卡数据的通学行为识别方法,其特征在于,所述步骤(1)中的原始刷卡数据包括:卡号、进站日期、进站时间、出站日期、出站时间、进站车站号、出站车站号、卡类型。3.根据权利要求2所述的一种基于地铁刷卡数据的通学行为识别方法,其特征在于,所述步骤(1)中对原始数据预处理包括:只保留卡类型为学生卡并且进站日期属于工作日的记录,并删除进站车站号和出站车站号相同以及进站日期和出站日期不同的异常数据。4.根据权利要求1所述的一种基于地铁刷卡数据的通学行为识别方法,其特征在于,所述步骤(1)中一定时间段的时长不低于三周。5.根据权利要求1所述的一种基于地铁刷卡数据的通学识别方法,其特征在于,所述步骤(3)中找出家车站和学校车站的候选车站包括:(31)判断每个卡号出现频次最高的车站的数量,若该车站数为1,则对应的车站为该卡号的候选车站Si1;若车站数为2,则对应的两个车站分别为该卡号的候选车站Si1和Si2;若车站数大于2,则将相距不超过指定阈值的站点合并,再令频次最高的车站为Si1,若合并后频次最高的车站数为2,则对应的两个车站分别为该卡号的候选车站Si1和Si2,若合并后频次最高的车站数仍大于2,则删除该卡号及相应记录;(32)对于...
【专利技术属性】
技术研发人员:季彦婕,顾宇,刘阳,刘攀,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。