一种基于通信数据和神经网络的实时地铁人流密度预测方法技术

技术编号:19935322 阅读:59 留言:0更新日期:2018-12-29 04:56
本发明专利技术涉及一种基于通信数据和神经网络的实时地铁人流密度预测方法,属于大数据与深度学习技术领域。包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,先构建地铁进出站数据集B,对一定距离范围内的通信数据进行清洗得到数据集C,以K个地铁站为聚类中心对数据集C进行处理,统计每类包含的乘客数p并作为t时刻的潜在乘客;组合数据集B、C,得到数据集A(t);再构建和训练权值共享循环神经网络模型,输入A(t),计算t时刻下的隐藏层神经元输出ht,然后计算共享层的输出st,最终计算输出yt,即可。本发明专利技术可以准确、快速地给出实时的地铁人流密度的预测,包括地铁站附近特殊情况下的人流密度预测。

【技术实现步骤摘要】
一种基于通信数据和神经网络的实时地铁人流密度预测方法
本专利技术涉及一种基于通信数据和权值共享循环神经网络的实时地铁人流密度预测方法,属于大数据与深度学习领域。
技术介绍
公共交通是一个城市中最重要的几个组成部分之一,随着大数据处理技术的成熟,人们对公共交通系统有了新的要求,为了出行的质量,需要第一时间知道公共交通的拥堵情况,甚至是未来一段时间的交通情况。公共交通情况的即时甚至超前反馈,对于决策者来说也是十分重要的。地铁作为公共交通的重要组成部分,承担了大部分的公共交通任务,对地铁人流密度进行预测,对于指导市民出行和公共交通管理都具有重要的现实意义。目前,对地铁人流的处理主要集中在现场监控和疏导方面,而且是依靠现场检测数据和历史数据进行,预测的准确性和实时性都较差,涉及地铁站周边一定范围内的潜在乘客的预测技术未见报道。
技术实现思路
本专利技术要解决的技术问题是针对现有技术不能对地铁人流进行实时预测或预测准确性差的缺点,提出一种基于通信数据和神经网络的实时地铁人流密度预测方法,利用地铁站及周边人员通信数据,通过权值共享的循环神经网络进行地铁人流密度的预测,实现地铁人流密度的实时预测,提高预测的准确性。为解决上述技术问题,本专利技术提供一种基于通信数据和神经网络的实时地铁人流密度预测方法,包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,具体过程如下:(1)进行数据预处理(1.1)构建地铁进出站数据集B=(t,in,out,num),即t时刻的进站人数、出站人数、站台等候人数;(1.2)对一定距离范围内的通信数据进行清洗,只保留用户编号、经度、纬度、时间,得到数据集c=(id,t,x,y);(1.3)对数据集c进行处理,对每个时刻t的数据进行聚类,以K个地铁站为聚类中心,采用欧氏距离进行聚类,聚类完成后统计每类包含的乘客数p,将其作为t时刻的潜在乘客;(1.4)组合数据集B、c,得到下面两个部分需要使用的数据集A(t)=(in,out,num,p),代表t时刻地铁站进站人数、出站人数、站内等待人数、潜在乘客人数,并将符号简化为A(t)={x0(t),...x3(t)};其中,in-t时刻的进站人数,out-t时刻的出站人数,num-t时刻的站台等候人数,id-通信用户编号,x-通信用户经度、y-通信用户纬度,t-时间,k-地铁站数(可根据实际需要具体确定),p-每类包含的乘客数,x0(t)-t时刻地铁站进站人数,x1(t)-t时刻地铁站出站人数,x2(t)-t时刻地铁站内等待人数,X3(t)-t时刻地铁站潜在乘客人数;(2)构建和训练权值共享循环神经网络模型,该模型包括一个输入层、一个隐藏层、一个权值共享层、一个输出层,即:(2.1)输入经步骤(1)数据预处理过程处理出的A(t)={x0(t),...x3(t)};(2.2)根据步骤(2.1)中的输入集合上一个时刻t-1时隐藏层的输出ht-1,计算t时刻下的隐藏层神经元输出ht=tanh(Whxxt+Whhht-1+bh);(2.3)根据步骤(2.2)中的t时刻隐藏层神经元的输出ht和多个神经网络共享的权值计算共享层的输出(2.4)根据步骤(2.3)计算出的共享层输出st计算最终输出yt=σ(Wosst+bo),即得到预测的下一个时刻的人流密度;其中,Whx、Wos-训练出来的模型的参数(即连接神经元之间的边的权重矩阵),bo、bs、bh-神经网络的偏置参数,xt-t时刻的输入,ht-1-上一个时刻隐藏层的神经元的输出值,Whh-上一个时刻隐藏层神经元输出对应的权值矩阵,-多个神经网络共享的权值;(3)实时预测地铁人流密度(3.1)实时接收地铁站的数据和通信数据,按照步骤(1)的数据预处理方式对实时接受到的数据进行处理,输出神经网络需要使用的输入数据集;(3.2)使用步骤(2)训练好的模型,对下一时刻的地铁站人流密度进行预测,得到预测结果。所述步骤(1.2)中进行清洗的通信数据距离范围为地铁站周边0.5-1km,具体根据实际需要确定。所述预测方法的整个操作过程均基于并行化的云计算引擎Resa完成,可以达到实时预测的效果。本专利技术的实施采用现有通信数据信息接收处理系统和信息机器学习处理系统等配合进行。本专利技术针对目前缺乏实时地铁人流密度预测技术的情况,采用地铁站原有的乘客数据构成系统背景数据,结合通信数据来挖掘出潜在的地铁乘客,将处于地铁站一定范围内的产生通信数据的人作为潜在乘客,并考虑周边会展、演出等特殊人流情况,通过聚类算法来决定哪些乘客会被划入范围,并利用深度学习中的循环神经网络作为预测的模型,对循环神经网络进行改进,考虑地铁站之间相互影响,构建一种权值共享的循环神经网络模型,采用在GitHub上开源的并行化计算系统Resa作为预测系统的计算引擎,继而用于地铁人流密度的实时预测,根据实时的数据去预测下一个时刻的地铁人流密度情况,使得模型预测的结果更加合理和准确,有效实现地铁人流密度的实时预测,为市民提供准确有效实时的预测数据,改善市民的出行体验。本专利技术提出的实时地铁人流密度预测方法具有数据预处理、模型训练、在线处理和预测三个功能,可以准确、快速的给出实时的地铁人流密度的预测,包括地铁站附近刚刚结束大型集会活动存在非常多潜在乘客而导致下一个时刻的地铁人流密度陡然上升等特殊情况下的人流密度预测。具有可准确、快速预测地铁站人流密度等优点。附图说明图1是本专利技术方法运行流程图。图2是本专利技术数据聚类样图。图3是本专利技术权值共享的循环神经网络图。图4是本专利技术循环神经网络神经元展开图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步详尽描述,实施例中未注明的技术或产品,均为现有技术或可以通过购买获得的常规产品。实施例1:如图1-4所示,本基于通信数据和神经网络的实时地铁人流密度预测方法包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,具体过程如下:(1)进行数据预处理(1.1)构建地铁进出站数据集B=(t,in,out,num),即t时刻的进站人数、出站人数、站台等候人数;(1.2)对地铁站周边0.5km距离范围内的通信数据进行清洗,只保留用户编号、经度、纬度、时间,得到数据集c=(id,t,x,y);(1.3)对数据集c进行处理,对每个时刻t的数据进行聚类,以k个地铁站为聚类中心,采用欧氏距离进行聚类,聚类完成后统计每类包含的乘客数p,将其作为t时刻的潜在乘客;(1.4)组合数据集B、c,得到下面两个部分需要使用的数据集A(t)=(in,out,num,p),代表t时刻地铁站进站人数、出站人数、站内等待人数、潜在乘客人数,并将符号简化为A(t)={x0(t),...x3(t)};其中,in-t时刻的进站人数,out-t时刻的出站人数,num-t时刻的站台等候人数,id-通信用户编号,x-通信用户经度、y-通信用户纬度,t-时间,K-作为聚类中心的地铁站数(k=8个),p-每类包含的乘客数,x0(t)-t时刻地铁站进站人数,x1(t)-t时刻地铁站出站人数,x2(t)-t时刻地铁站内等待人数,X3(t)-t时刻地铁站潜在乘客人数;(2)构建和训练权值共享循环神经网络模型,该模型包括一个输入层、一个隐藏层、本文档来自技高网...

【技术保护点】
1.一种基于通信数据和神经网络的实时地铁人流密度预测方法,其特征在于:所述预测方法包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,具体过程如下:(1)进行数据预处理(1.1)构建地铁进出站数据集B=(t,in,out,num),即t时刻的进站人数、出站人数、站台等候人数;(1.2)对一定距离范围内的通信数据进行清洗,只保留用户编号、经度、纬度、时间,得到数据集C=(id,t,x,y);(1.3)对数据集C进行处理,对每个时刻t的数据进行聚类,以K个地铁站为聚类中心,采用欧氏距离进行聚类,聚类完成后统计每类包含的乘客数p,将其作为t时刻的潜在乘客;(1.4)组合数据集B、C,得到下面两个部分需要使用的数据集A(t)=(in,out,num,p),代表t时刻地铁站进站人数、出站人数、站内等待人数、潜在乘客人数,并将符号简化为A(t)={x0(t),...x3(t)};其中,in‑t时刻的进站人数,out‑t时刻的出站人数,num‑t时刻的站台等候人数,id‑通信用户编号,x‑通信用户经度、y‑通信用户纬度,t‑时间,k‑地铁站数,p‑每类包含的乘客数,x0(t)‑t时刻地铁站进站人数,x1(t)‑t时刻地铁站出站人数,x2(t)‑t时刻地铁站内等待人数,x3(t)‑t时刻地铁站潜在乘客人数;(2)构建和训练权值共享循环神经网络模型,该模型包括一个输入层、一个隐藏层、一个权值共享层、一个输出层,即:(2.1)输入经步骤(1)数据预处理过程处理出的A(t)={x0(t),...x3(t)};(2.2)根据步骤(2.1)中的输入集合上一个时刻t‑1时隐藏层的输出ht‑1,计算t时刻下的隐藏层神经元输出ht=tanh(Whxxt+Whhht‑1+bh);(2.3)根据步骤(2.2)中的t时刻隐藏层神经元的输出ht和多个神经网络共享的权值...

【技术特征摘要】
1.一种基于通信数据和神经网络的实时地铁人流密度预测方法,其特征在于:所述预测方法包括数据预处理、构建和训练权值共享循环神经网络模型、实时预测地铁人流密度三个步骤,具体过程如下:(1)进行数据预处理(1.1)构建地铁进出站数据集B=(t,in,out,num),即t时刻的进站人数、出站人数、站台等候人数;(1.2)对一定距离范围内的通信数据进行清洗,只保留用户编号、经度、纬度、时间,得到数据集C=(id,t,x,y);(1.3)对数据集C进行处理,对每个时刻t的数据进行聚类,以K个地铁站为聚类中心,采用欧氏距离进行聚类,聚类完成后统计每类包含的乘客数p,将其作为t时刻的潜在乘客;(1.4)组合数据集B、C,得到下面两个部分需要使用的数据集A(t)=(in,out,num,p),代表t时刻地铁站进站人数、出站人数、站内等待人数、潜在乘客人数,并将符号简化为A(t)={x0(t),...x3(t)};其中,in-t时刻的进站人数,out-t时刻的出站人数,num-t时刻的站台等候人数,id-通信用户编号,x-通信用户经度、y-通信用户纬度,t-时间,k-地铁站数,p-每类包含的乘客数,x0(t)-t时刻地铁站进站人数,x1(t)-t时刻地铁站出站人数,x2(t)-t时刻地铁站内等待人数,x3(t)-t时刻地铁站潜在乘客人数;(2)构建和训练权值共享循环神经网络模型,该模型包括一个输入层、一个隐藏层、一个权值共享层、一个输出层,即:(2....

【专利技术属性】
技术研发人员:马廷淮梁新年李婧
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1