一种基于POI数据和客流数据的地铁站聚类与回归分析方法及系统技术方案

技术编号:19824435 阅读:36 留言:0更新日期:2018-12-19 15:39
本发明专利技术提供一种基于POI数据与客流数据的地铁站聚类与回归分析方法及系统。方法包括:通过地理信息系统统计软件,采集地铁站周边不同功能的POI数量,基于AFC刷卡数据,统计地铁站日均进出站客流量,生成待处理的数据集。基于地铁站周边不同类别POI数量,采用聚类方法对地铁站服务强度等级划分。以日均客流量为因变量,POI数量为自变量,通过回归分析,寻找地铁站点周边的POI种类及数量对地铁站客流的影响关系。本发明专利技术提供的方法及系统,采用POI数据和AFC刷卡数据,将动态数据与静态数据相结合,能够直观有效衡量地铁站规模,全面分析不同地铁站的功能定位与服务水平。针对不同地铁站类型,为应对不同的客流特征提出建议。

【技术实现步骤摘要】
一种基于POI数据和客流数据的地铁站聚类与回归分析方法及系统
本专利技术涉及交通信息
,更具体地,涉及一种地铁站聚类与回归分析方法及系统。
技术介绍
城市轨道交通承担着客运交通输送的重要任务,是公共交通出行的重要环节。应对地铁站高峰时段的庞大客流,合理有序地组织乘客进出站、搭乘轨道交通,需要掌握地铁客流的出行规律。研究地铁站周围兴趣点POI(pointofinterest)的数量及类型,同时分析地铁站日均进出站客流量的历史数据,将静态数据与动态数据相结合,全面分析北京市不同地铁站的功能定位与服务水平。针对不同地铁站类型,为应对不同的客流特征提出建议。不同地铁站周边环境不同,服务的功能和对象有差异,因此对于不同地铁站,客流强度往往取决于周边交通发生与吸引的兴趣点,比如休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育等等,这些POI影响着客流出行的需求,以及出行OD对。近年来,学者提出了多种方法,对地铁站点客流进行预测和分析。但是预测和分析通常只针对站点客流信息数据,对于地铁站周边交通兴趣点的分析和挖掘相对较少。将实际数据与理论模型的结合程度不够,对影响地铁站客流因素的分析挖掘不够深入。
技术实现思路
本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种公交车客流量的分析方法及系统。根据本专利技术的一个方面,提供一种基于POI数据与客流数据的地铁站聚类与回归分析方法,包括:采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集;基于聚类分析,根据所述数据集,量化地铁站的服务规模;基于回归分析,寻找地铁站周边的POI种类及数量对客流的影响关系;其中,所述数据集,包括地铁站日均进出站客流,以及周边不同功能的POI数量,包括但不限于休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区和停车场中的一种或多种。根据本专利技术的另一个方面,提供一种基于POI数据与客流数据的地铁站聚类与回归分析系统,包括:POI数据获取模块,用于采集地铁站周边不同功能的POI数量;地铁站客流量获取模块,用于根据原始地铁AFC交易记录,获取有效的地铁站日均进出站客流量信息;聚类分析模块,用于根据所述数据集,将地铁站划分为不同类别,相同类别下地铁站特性相似,不同类别间地铁站差异显著;回归分析模块,用于探究地铁站周边的POI种类及数量对客流的影响关系;其中,所述数据集,包括地铁站日均进出站客流,以及周边不同功能的POI数量,包括但不限于休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区和停车场中的一种或多种。根据本专利技术的再一个方面,提供一种计算机设备,包括存储器和处理器,所述处理器和所述存储器通过总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的方法。根据本专利技术的还一个方面,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的方法。本专利技术提供的一种基于POI数据与客流数据的地铁站聚类与回归分析方法及系统,考虑了除客流量以外的,地铁站周边POI种类及数量对地铁站规模的影响,数据处理简单,成本低;通过对地铁站周边POI种类和数量的分析,有助于判断影响地铁站客流的因素,进而对各地铁站的客流强度进行合理预测,有效应对可能出现的大规模客流。与此同时,针对这些指标,采用聚类方法,能系统地将地铁站划分为不同的等级,根据不同等级的地铁站具有的不同客流属性,提高各地铁站的服务水平,进而提升地铁的便捷性、通达性,实现轨道交通的高效运转。附图说明图1为一种基于POI数据与客流数据的地铁站聚类与回归分析方法及系统流程图;图2为根据本专利技术实施例提供的某年某月北京地铁AFC刷卡部分原始数据图3为根据本专利技术实施例提供的北京各地铁站进出站客流量部分统计数据图4为根据本专利技术实施例提供的北京地铁站空间分布图;图5为根据本专利技术实施例提供的由北京各地铁站为中心,500m为半径的缓冲区;图6为根据本专利技术实施例提供的北京各地铁站周围POI数量及分布图;图7为根据本专利技术实施例提供的典型判别函数下,聚类中心与其他样本点的分布关系图;图8为根据本专利技术实施例提供的北京地铁站聚类结果分布图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。图1为根据本专利技术实施例提供的一种基于POI数据与客流数据的地铁站聚类与回归分析方法及系统流程图,如图1所示,该方法包括:采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集;基于聚类分析,根据所述数据集,量化地铁站的服务规模;基于回归分析,寻找地铁站周边的POI种类及数量对客流的影响关系;其中,所述数据集,包括地铁站日均进出站客流,以及周边不同功能的POI数量,包括但不限于休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区和停车场中的一种或多种。基于上述实施例,所述采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集,之前还包括:建立地铁运营信息数据库;将通过网络实时获取到的原始地铁AFC交易记录,存入所述地铁运营信息数据库中;在所述地铁运营信息数据库中,统计所述地铁站日均进出站客流量。其中,所述在所述地铁运营信息数据库中,统计所述地铁站日均进出站客流量,进一步包括:在所述地铁运营信息数据库中,将AFC数据按日期、地铁站点分类汇总,得到每个地铁站点每天的进站总客流和出站总客流。其中,换乘站进出站客流为通过该站所有线路的所有出入口进出站客流之和;再对各站客流数据取平均值,得到各地铁站日均进出站客流,作为分析指标。基于上述实施例,所述采集地铁站周边不同功能的POI数量,进一步包括:基于对地理信息文件中各交通兴趣点的统计整合,采用地理统计软件,以各地铁站为中心,建立一定半径的缓冲区;再基于叠加分析与空间连接,分别统计所述各地铁站建立的一定半径的缓冲区内,包含的各类POI的数量,生成地铁站POI统计表。基于上述实施例,本实施例为了方便本专利技术的参数理解及算法实现,选取具体基础数据对上述实施例中的方案进行具体说明。具体地,实施例采用北京地铁AFC数据,站点周边POI数据及相关数据进行分析处理。第一步,AFC数据预处理。客流数据来源于某年某月共计30天北京地铁进出站闸机AFC进出站记录(如图2所示)。通过SQLServer数据库处理软件,将刷卡数据按日期、地铁站点分类汇总,得到每个地铁站点,每天的进站总客流和出站总客流(如图3所示),换乘站进出站客流为通过该站所有线路的所有出入口进出站客流之和。再对数据取平均值,得到各地铁站全月30天的日均进出站客流,作为分析指标。第二步,地铁站周边POI数据生成。POI数据基于对北京地图地理信息文件Shapefile中各交通兴趣点的统计整合,利用ArcGIS地理统计软件,首先以北京市各地铁站(图4)为中心,建立半径为500m的缓冲区(图5),再利用叠加分析,进行空间连接,分别统计各地铁站500m的半径内,包含的休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区及停车场等各类POI的数量(图6),本文档来自技高网...

【技术保护点】
1.一种基于POI数据与客流数据的地铁站聚类与回归分析方法,其特征在于,包括:采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集;基于聚类分析,根据所述数据集,量化地铁站的服务规模;基于回归分析,寻找地铁站周边的POI种类及数量对客流的影响关系;其中,所述数据集,包括地铁站日均进出站客流,以及周边不同功能的POI数量,包括但不限于休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区和停车场中的一种或多种。

【技术特征摘要】
1.一种基于POI数据与客流数据的地铁站聚类与回归分析方法,其特征在于,包括:采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集;基于聚类分析,根据所述数据集,量化地铁站的服务规模;基于回归分析,寻找地铁站周边的POI种类及数量对客流的影响关系;其中,所述数据集,包括地铁站日均进出站客流,以及周边不同功能的POI数量,包括但不限于休闲娱乐、医疗服务、住宅小区、商业大厦、科研教育、公交车站、风景名胜区和停车场中的一种或多种。2.根据权利要求1所述的方法,其特征在于,所述采集地铁站周边不同功能的POI数量,统计地铁站日均进出站客流量,生成数据集,之前还包括:建立地铁运营信息数据库;将通过网络实时获取到的原始地铁AFC交易记录,存入所述地铁运营信息数据库中;在所述地铁运营信息数据库中,统计所述地铁站日均进出站客流量。3.根据权利要求2所述的方法,其特征在于,在所述地铁运营信息数据库中,统计所述地铁站日均进出站客流量,进一步包括:在所述地铁运营信息数据库中,将AFC数据按日期、地铁站点分类汇总,得到每个地铁站点每天的进站总客流和出站总客流。其中,换乘站进出站客流为通过该站所有线路的所有出入口进出站客流之和;再对各站客流数据取平均值,得到各地铁站日均进出站客流,作为分析指标。4.根据权利要求1所述的方法,其特征在于,所述采集地铁站周边不同功能的POI数量,进一步包括:基于对地理信息文件中各交通兴趣点的统计整合,采用地理统计软件,以各地铁站为中心,建立一定半径的缓冲区;再基于叠加分析与空间连接,分别统计所述各地铁站建立的一定半径的缓冲区内,包含的各类POI的数量,生成地铁站POI统计表。5.根据权利要求1所述的方法,其特征在于,所述基于聚类分析,根据所述数据集,量化地铁站的服务规模,进一步包括:根据各地铁站周边POI的数量及类型,以及地铁日均进出站客流,将地铁站进行聚类。首先设定类别数,从数据对象任意选择与类别数相同的对象作为初始聚类中心;对于其它对象,则根据它们与这些聚类中心的相似度,分别将它们分配给与其最相似的聚类中心所代表的聚类;然后再计算每个所...

【专利技术属性】
技术研发人员:马晓磊沈宣良杜博文
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1