地铁乘客下车时间识别方法、系统、计算机设备及存储介质技术方案

技术编号:21274113 阅读:37 留言:0更新日期:2019-06-06 08:18
本发明专利技术公开了一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质,所述方法包括:获取数据源,包括地铁到站时刻表和地铁乘客出站IC卡数据表;对地铁乘客出站IC卡数据表进行预处理;根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量;利用K‑means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将其聚类成与地铁班次数量一致的簇;根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。本发明专利技术通过对地铁到站时刻表和地铁乘客出站IC卡数据表进行数据挖掘,运用修正后的K‑means聚类方法进行地铁乘客下车时间识别,识别精确度较高。

【技术实现步骤摘要】
地铁乘客下车时间识别方法、系统、计算机设备及存储介质
本专利技术涉及一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质,属于时空数据挖掘及交通

技术介绍
近年来,利用IC卡数据挖掘分析城市居民交通出行特征规律,并以此指导城市交通管理与规划成为热门趋势。针对地铁系统,无论分析地铁乘客的时空分布,还是模拟地铁的运营状况或者实时预测地铁密度,都会用到两个时间常量,那就是在假设乘客步行速度一定的前提下,离开地铁门后步行到达收费闸门的时间以及从地铁收费闸门到站台的步行时间。目前还没有针对地铁乘客地铁门后步行到达收费闸门的时间做计算的方法,但这个步行时间对于模拟地铁运营状况以及乘客的时空分布很重要的,例如可以通过识别乘客所乘坐的地铁班次,进一步计算出不同时间段地铁乘客出站密度和速度,这个是模拟地铁运营状况的基础。针对如何识别出乘客所乘坐的地铁班次,传统的方法主要是通过志愿者统计、人工调查问卷等方法,耗费大量的人力和物力。基于IC卡数据进行数据挖掘是新的方向,但IC卡数据中并不包含乘客下车时间。
技术实现思路
有鉴于此,本专利技术提供了一种地铁乘客下车时间识别方法、系统、计算机设备及存储介质,通过对地铁到站时刻表和地铁乘客出站IC卡数据表进行数据挖掘,分析其时空特性关系,并运用修正后的K-means聚类方法进行地铁乘客下车时间识别,识别精确度较高。本专利技术的第一个目的在于提供一种地铁乘客下车时间识别方法。本专利技术的第二个目的在于提供一种地铁乘客下车时间识别系统。本专利技术的第三个目的在于提供一种计算机设备。本专利技术的第四个目的在于提供一种存储介质。本专利技术的第一个目的可以通过采取如下技术方案达到:一种地铁乘客下车时间识别方法,所述方法包括:获取数据源;其中,所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表;对地铁乘客出站IC卡数据表进行预处理;根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量;利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇;根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。进一步的,所述对地铁乘客出站IC卡数据表进行预处理,具体包括:从地铁乘客出站IC卡数据表中选择一个地铁站点作为研究对象,筛选该地铁站点的地铁乘客出站IC卡数据;选择该地铁站点在某个研究时段内的地铁乘客出站IC卡数据;对该地铁站点在研究时段内的地铁乘客出站IC卡数据中时间重复、有误的数据进行过滤,确保每张IC卡对应研究时段内的一个出站刷卡时间。进一步的,所述根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量,具体包括:根据地铁到站时刻表中研究时段的起点和终点,统计该研究时段内到达地铁站点的地铁班次数量,记录该研究时段内的每趟班次及其到达时间。进一步的,所述利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇,具体包括:将研究时段内到达地铁站点的地铁班次数量作为K-means算法的聚类数,先随机选取K个聚类质心点,重复以下过程直到收敛,使该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇:将该地铁乘客出站IC卡数据表中的每个地铁乘客出站IC卡数据作为一个样例,对于每个样例,计算该样例应该属于的类,如下式:c(i):=argmin(j)||x(i)-μj||2其中,c(i)表示样例i与K个类中距离最近的那个类,值为1到K中的一个,μj表示对属于同一个类的样本中心点的猜测,x(i)表示样例i的数据;对于每个类j,重新计算该类的质心,如下式:其中,μj表示重新计算后的质心。进一步的,所述根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间,具体包括:将预设时间阈值作为聚类质心的邻域半径,将属于邻域内的地铁乘客归为同一地铁班次,得到每位乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。进一步的,所述地铁到站时刻表包括地铁线路名称、地铁站点、到达地铁站点的时间和地铁班次编号;所述地铁乘客出站IC卡数据表中的每个地铁乘客IC卡数据包括IC卡号、地铁出站时间和出站地铁站点,以IC卡号作为乘客的唯一标识,匹配地铁乘客的一次地铁出站时间和出站地铁站点。进一步的,所述对地铁乘客出站IC卡数据表进行预处理之后,还包括:对预处理后的地铁乘客出站IC卡数据表中的地铁乘客出站IC卡数据按照时间进行升序排序。本专利技术的第二个目的可以通过采取如下技术方案达到:一种地铁乘客下车时间识别系统,所述系统包括:获取模块,获取数据源;其中,所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表;预处理模块,用于地铁乘客出站IC卡数据表;分析模块,用于根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量;聚类模块,用于利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇;修正模块,用于根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。本专利技术的第三个目的可以通过采取如下技术方案达到:一种计算机设备,包括处理器以及用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现上述的地铁乘客下车时间识别方法。本专利技术的第四个目的可以通过采取如下技术方案达到:一种存储介质,存储有程序,所述程序被处理器执行时,实现上述的地铁乘客下车时间识别方法。本专利技术相对于现有技术具有如下的有益效果:本专利技术通过对地铁到站时刻表和地铁乘客出站IC卡数据表中的数据进行预处理,利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,修正聚类结果,能够推算出地铁乘客所乘坐的地铁班次,进一步识别出地铁乘客下车时间,为计算地铁乘客离开地铁门后步行到达收费闸门的时间提供数据支撑,且识别精确度较高。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本专利技术实施例1的地铁乘客下车时间识别方法的流程图。图2为本专利技术实施例1的地铁乘客出站IC卡数据表预处理的流程图。图3为本专利技术实施例1的修正后的聚类结果图。图4为本专利技术实施例2的地铁乘客下车时间识别系统的结构框图。图5为本专利技术实施例2的预处理模块的结构框图。图6为本专利技术实施例3的计算机设备的结构框图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1:如图1本文档来自技高网...

【技术保护点】
1.一种地铁乘客下车时间识别方法,其特征在于,所述方法包括:获取数据源;其中,所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表;对地铁乘客出站IC卡数据表进行预处理;根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量;利用K‑means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇;根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。

【技术特征摘要】
1.一种地铁乘客下车时间识别方法,其特征在于,所述方法包括:获取数据源;其中,所述数据源包括地铁到站时刻表和地铁乘客出站IC卡数据表;对地铁乘客出站IC卡数据表进行预处理;根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量;利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇;根据预设时间阈值,对聚类后的识别结果进行修正,得到每位地铁乘客的乘坐地铁班次,并结合地铁到站时刻表得到每位地铁乘客的下车时间。2.根据权利要求1所述的地铁乘客下车时间识别方法,其特征在于,所述对地铁乘客出站IC卡数据表进行预处理,具体包括:从地铁乘客出站IC卡数据表中选择一个地铁站点作为研究对象,筛选该地铁站点的地铁乘客出站IC卡数据;选择该地铁站点在某个研究时段内的地铁乘客出站IC卡数据;对该地铁站点在研究时段内的地铁乘客出站IC卡数据中时间重复、有误的数据进行过滤,确保每张IC卡对应研究时段内的一个出站刷卡时间。3.根据权利要求1所述的地铁乘客下车时间识别方法,其特征在于,所述根据地铁到站时刻表,分析在研究时段内到达地铁站点的地铁班次数量,具体包括:根据地铁到站时刻表中研究时段的起点和终点,统计该研究时段内到达地铁站点的地铁班次数量,记录该研究时段内的每趟班次及其到达时间。4.根据权利要求1所述的地铁乘客下车时间识别方法,其特征在于,所述利用K-means算法对预处理后的地铁乘客出站IC卡数据表进行聚类,将该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇,具体包括:将研究时段内到达地铁站点的地铁班次数量作为K-means算法的聚类数,先随机选取K个聚类质心点,重复以下过程直到收敛,使该地铁乘客出站IC卡数据表聚类成与地铁班次数量一致的簇:将该地铁乘客出站IC卡数据表中的每个地铁乘客出站IC卡数据作为一个样例,对于每个样例,计算该样例应该属于的类,如下式:c(i):=argmin(j)||x(i)-μj||2其中,c(i)表示样例i与K个类中距离最近的那个类,值为1到K中的一个,μj表示对属于同一个类的样本中心点的猜测,x(i)表示...

【专利技术属性】
技术研发人员:黄紫林许伦辉
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1