【技术实现步骤摘要】
一种基于大数据的地铁站客流量预测方法
本专利技术涉及机器学习、大数据处理、人工智能领域,尤其是地铁站客流量预测方法。
技术介绍
当今世界城市化和工业化飞速发展,大量的人口涌入城市,给城市管理和城市交通带来巨大的压力。而地铁作为城市交通的中坚力量,能有效缓解交通拥堵,提高城市交通的效率。地铁存在着速度快,时间短,票价低和便捷等优点,因此,越来越多的人选择乘坐地铁出行,节约了时间,还避免了道路交通拥堵,减小交通压力。对于地铁乘客出行行为规律的研究是地铁研究的重要基础。随着我国城市地铁交通建设的发展,城市化进程的快速推进,地铁交通在城市交通中占比也越来越大。随着地铁客流量的不断增大,地铁安保问题也日益显现出来。地铁目前是城市交通出行的主要工具之一,地铁站突发人流量的增加极容易引起拥塞,引发大客流对冲,造成安全隐患。因此,地铁运营部门和公安机关亟需通过流量预测技术提前部署相应的安保策略,保障市民安全出行。因此如何通过分析地铁人流相关数据,挖掘隐藏在背后的出行规律,准确预测各个地铁站点未来流量的变化,已经成为地铁出行方面急需解决的问题,用大数据和人工智能等技术助力未来城市安 ...
【技术保护点】
1.一种基于大数据的地铁站客流量预测方法,其特征在于,包括以下步骤:101.对地铁站的历史刷卡数据进行预处理操作;102.根据地铁站历史刷卡数据划分训练集数据和验证集数据;103.对地铁站的历史刷卡数据进行特征工程操作,构建特征;104.对构建的特征进行特征选择;105.建立多个机器学习模型,并进行模型融合操作,获得最终模型;106.通过建立的最终模型,根据地铁站历史刷卡数据对地铁站未来的客流量进行预测。
【技术特征摘要】
1.一种基于大数据的地铁站客流量预测方法,其特征在于,包括以下步骤:101.对地铁站的历史刷卡数据进行预处理操作;102.根据地铁站历史刷卡数据划分训练集数据和验证集数据;103.对地铁站的历史刷卡数据进行特征工程操作,构建特征;104.对构建的特征进行特征选择;105.建立多个机器学习模型,并进行模型融合操作,获得最终模型;106.通过建立的最终模型,根据地铁站历史刷卡数据对地铁站未来的客流量进行预测。2.根据权利要求1所述一种基于大数据的地铁站客流量预测方法,其特征在于:所述预处理操作包括:缺失值的处理:当字段缺失率小于30%时,采用EM算法对缺失数据进行极大似然估计;当字段缺失率大于等于30%时,对样本采取删除操作;异常数据样本的处理:当某几条数据样本表示同一旅客ID在同一或者不同地铁站同一天连续两次刷卡进站或者出站,只保留时间戳最早的数据,其余数据进行删除处理;原始时间字段time处理:将time字段分解为年月日字段、小时字段和分钟字段;其他处理:对于地铁站之间的邻接关系制作邻接矩阵表,并通过邻接矩阵表求解任意两站之间的最短路径。3.根据权利要求2所述一种基于大数据的地铁站客流量预测方法,其特征在于:所述EM算法中,E步通过对给定数据的观测,对地铁站历史刷卡数据的缺失值求出条件期望,并且利用计算出的条件期望对缺失数据进行填充插补;M步是做极大化似然估计,对M步之后的完整地铁站历史刷卡数据的参数进行极大似然估计。4.根据权利要求1所述一种基于大数据的地铁站客流量预测方法,其特征在于:所述训练集数据和验证集数据的划分采取按时间段滑窗法划分数据,训练集与验证集特征区间日为标签区间日的前一天;验证集的构建采用滑窗窗口层面上的留一交叉验证法,将一个窗口留出作为验证集。5.根据权利要求1所述一种基于大数据的地铁站客流量预测方法,其特征在于:所述构建特征包括基础计...
【专利技术属性】
技术研发人员:王进,任超,孙开伟,邓欣,刘彬,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。