地铁乘客下车时间识别方法、系统、计算机设备及存储介质技术方案

技术编号：21274113 阅读：37 留言：0更新日期：2019-06-06 08:18

本发明专利技术公开了一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质，所述方法包括：获取数据源，包括地铁到站时刻表和地铁乘客出站IC卡数据表；对地铁乘客出站IC卡数据表进行预处理；根据地铁到站时刻表，分析在研究时段内到达地铁站点的地铁班次数量；利用K‑means算法对预处理后的地铁乘客出站IC卡数据表进行聚类，将其聚类成与地铁班次数量一致的簇；根据预设时间阈值，对聚类后的识别结果进行修正，得到每位地铁乘客的乘坐地铁班次，并结合地铁到站时刻表得到每位地铁乘客的下车时间。本发明专利技术通过对地铁到站时刻表和地铁乘客出站IC卡数据表进行数据挖掘，运用修正后的K‑means聚类方法进行地铁乘客下车时间识别，识别精确度较高。

全部详细技术资料下载

【技术实现步骤摘要】
地铁乘客下车时间识别方法、系统、计算机设备及存储介质
本专利技术涉及一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质，属于时空数据挖掘及交通

技术介绍
近年来，利用IC卡数据挖掘分析城市居民交通出行特征规律，并以此指导城市交通管理与规划成为热门趋势。针对地铁系统，无论分析地铁乘客的时空分布，还是模拟地铁的运营状况或者实时预测地铁密度，都会用到两个时间常量，那就是在假设乘客步行速度一定的前提下，离开地铁门后步行到达收费闸门的时间以及从地铁收费闸门到站台的步行时间。目前还没有针对地铁乘客地铁门后步行到达收费闸门的时间做计算的方法，但这个步行时间对于模拟地铁运营状况以及乘客的时空分布很重要的，例如可以通过识别乘客所乘坐的地铁班次，进一步计算出不同时间段地铁乘客出站密度和速度，这个是模拟地铁运营状况的基础。针对如何识别出乘客所乘坐的地铁班次，传统的方法主要是通过志愿者统计、人工调查问卷等方法，耗费大量的人力和物力。基于IC卡数据进行数据挖掘是新的方向，但IC卡数据中并不包含乘客下车时间。
技术实现思路
有鉴于此，本专利技术提供了一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质，通过对地铁到站时刻表和地铁乘客出站IC卡数据表进行数据挖掘，分析其时空特性关系，并运用修正后的K-means聚类方法进行地铁乘客下车时间识别，识别精确度较高。本专利技术的第一个目的在于提供一种地铁乘客下车时间识别方法。本专利技术的第二个目的在于提供一种地铁乘客下车时间识别系统。本专利技术的第三个目的在于提供一种计算机设备。本专利技术的第四个目的在于提供一种存储介质。本专...

【技术保护点】
1.一种地铁乘客下车时间识别方法，其特征在于，所述方法包括：获取数据源；其中，所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表；对地铁乘客出站IC卡数据表进行预处理；根据地铁到站时刻表，分析在研究时段内到达地铁站点的地铁班次数量；利用K‑means算法对预处理后的地铁乘客出站IC卡数据表进行聚类，将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇；根据预设时间阈值，对聚类后的识别结果进行修正，得到每位地铁乘客的乘坐地铁班次，并结合地铁到站时刻表得到每位地铁乘客的下车时间。

【技术特征摘要】
1.一种地铁乘客下车时间识别方法，其特征在于，所述方法包括：获取数据源；其中，所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表；对地铁乘客出站IC卡数据表进行预处理；根据地铁到站时刻表，分析在研究时段内到达地铁站点的地铁班次数量；利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类，将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇；根据预设时间阈值，对聚类后的识别结果进行修正，得到每位地铁乘客的乘坐地铁班次，并结合地铁到站时刻表得到每位地铁乘客的下车时间。2.根据权利要求1所述的地铁乘客下车时间识别方法，其特征在于，所述对地铁乘客出站IC卡数据表进行预处理，具体包括：从地铁乘客出站IC卡数据表中选择一个地铁站点作为研究对象，筛选该地铁站点的地铁乘客出站IC卡数据；选择该地铁站点在某个研究时段内的地铁乘客出站IC卡数据；对该地铁站点在研究时段内的地铁乘客出站IC卡数据中时间重复、有误的数据进行过滤，确保每张IC卡对应研究时段内的一个出站刷卡时间。3.根据权利要求1所述的地铁乘客下车时间识别方法，其特征在于，所述根据地铁到站时刻表，分析在研究时段内到达地铁站点的地铁班次数量，具体包括：根据地铁到站时刻表中研究时段的起点和终点，统计该研究时段内到达地铁站点的地铁班次数量，记录该研究时段内的每趟班次及其到达时间。4.根据权利要求1所述的地铁乘客下车时间识别方法，其特征在于，所述利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类，将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇，具体包括：将研究时段内到达地铁站点的地铁班次数量作为K-means算法的聚类数，先随机选取K个聚类质心点，重复以下过程直到收敛，使该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇：将该地铁乘客出站IC卡数据表中的每个地铁乘客出站IC卡数据作为一个样例，对于每个样例，计算该样例应该属于的类，如下式：c(i):＝argmin(j)||x(i)-μj||2其中，c(i)表示样例i与K个类中距离最近的那个类，值为1到K中的一个，μj表示对属于同一个类的样本中心点的猜测，x(i)表示...

【专利技术属性】
技术研发人员：黄紫林，许伦辉，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人