一种基于EMD的断面客流神经网络预测方法技术

技术编号:9935645 阅读:128 留言:0更新日期:2014-04-18 08:07
一种基于EMD的断面客流神经网络预测方法,其特征在于,该方法步骤如下:第一步:获取数据本征模函数分量;将每日每30分钟间隔时段内OD间的汇总客流量分配到断面客流信息中,形成断面客流量原始序列;根据数据的特征时间尺度来经验地识别出固有振荡模态,然后据此把一个非平稳信号分解为一系列本征模函数和一个冗余分量之和,即经验模式分解处理得到本征模函数IMF分量;每个IMF分量需满足两个条件:①过零点的数量与极值点的数量相等或至多相差一个;②在任一时间点,局部最大值确定的上包络线和局部最小值确定的下包络线的均值为零,即信号关于时间轴局部对称;第二步:组件识别;将原始断面客流数据中不同尺度的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列;最低频率的IMF分量代表原始序列的长期趋势或均值,最高频率的IMF分量代表原始序列的短期特征;相关系数ρxy是用以反映变量之间相关关系密切程度的统计指标,相关系数ρxy取值在?1到1之间,ρxy=0时,称X、Y不相关;|ρxy|=1时,称X、Y完全相关,此时,X、Y之间具有线性函数关系;|ρxy|<1时,X的变动引起Y的部分变动,|ρxy|越大,X的变动引起Y的变动就越大,|ρxy|>0.8时称为高度相关,当|ρxy|<0.3时,称为低度相关,其他为中度相关;这里,采用皮尔森相关系数;ρxy=1n-1Σi=1n(Xi-X‾SX)(Yi-Y‾SY),---12)]]>式中:n—样本数量,—样本的平均值,SX,SY—样本标准差;第三步:BP神经网络预测;(1)样本的选取根据组件识别环节中剩余的有效序列,对其进行随机划分,80%为训练集,20%测试集;(2)样本的归一化处理由于采集的各数据单位不一致,因而须对数据进行[?1,1]归一化处理,归一化方法为:X0=(X?Xmin)(Xmax?Xmin),???13)式中:X、X0分别为转换前、后的值,Xmax、Xmin分别为样本的最大值和最小值;(3)BP神经网络构建;(3.1)输入、输出层节点确定;输入层有M个输入节点,分别代表断面客流序列不同的IMF分量;输出层有N个输出节点,分别代表对应的未来的断面客流量;(3.2)隐含层层数以及隐含层节点数确定;所述隐含层层数为单隐层;隐含层节点数公式:n=M+N+a,---14)]]>式中:n为隐含层节点数,M为输入节点数,N为输出节点数,a为0?10之间的常数;(3.3)传递函数选择本发明专利技术中隐含层传递函数采用Tan?Sigmoid型函数;输出层传递函数采用线性purelin函数;(3.4)学习参数选择①学习速率的确定:所述学习速率的选取范围在0.01?0.8;②动量因子的确定:动量因子的取值范围在0?1之间;(3.5)BP神经网络训练使用LM(Levenberg?Marquardt)算法进行BP神经网络训练;(4)BP神经网络预测将测试数据作为输入层的输入数据,代入到BP神经网络中进行预测,得到输出与真实结果对比分析以及相对误差。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了属于轨道运输
的一种基于EMD的断面客流神经网络预测方法。该方法先获取本征模函数分量:将每日每30分钟间隔时段内OD间的汇总客流量分配到断面客流信息中,形成断面客流量原始序列,对原始序列进行经验模式分解处理,获得IMF分量,组成IMF矩阵;组件识别:计算每个IMF分量与原始客流序列的皮尔森相关系数,分析与原始数据的相关性;神经网络预测:构建三层BP网络模型,将测试数据作为输入层的输入数据,代入到BP神经网络中进行预测,得到相应的断面客流量输出。本专利技术提出的混合EMD和神经网络的方法,分析客流数据特征,为神经网络预测方法提供输入变量。本专利技术可得断面客流预测精度均大于95%。【专利说明】一种基于EMD的断面客流神经网络预测方法专利
本专利技术涉及一种基于EMD的断面客流神经网络预测方法,属于轨道运输

技术介绍
近年来,我国城市轨道交通发展迅速,轨道交通路网客运量持续攀升。庞大的客流量以及在路网上复杂的时空分布为中国城市轨道交通客流组织安全带来了巨大的挑战,实时、准确的短时交通流预测已成为中国城市轨道交通路网安全高效运营管理迫切需要解决的问题。交通量预测的结果将为运输系统管理提供参考,例如,运营管理规划、站点客流拥挤管制计划等。多年来,国内外研究人员致力于交通流预测模型和预测方法的研究不断,但随着预测时间跨度的缩短,交通流显示出来的非线性、时变性、不确定性越来越强,导致交通流的预测效果和预测精度不甚理想。对于短时断面交通流量来说,瞬间短时交通流量包括以下3个部分:一、去除所有不确定性因素的反映交通流基本变化规律的交通流信息,即交通流变化的基本趋势;二、本质不确定性因素造成交通流突变趋势;三、非本质不确定性因素造成的交通流突变趋势。后两部分随机地影响了交通流的实时流量,使得交通流围绕在基本趋势附近发生扰动,甚至在某些时候,由于不确定因素的强烈干扰,使得这种扰动十分激烈。因此,对于短期客流预测模型而言,捕捉短期客流量特征是很有必要的。在特征提取方面,经验模式分解(Empirical Mode Decomposition, EMD)是一种较新的信号处理方法,具有自适应 和高信噪比的特点,十分适合于非平稳、非线性信号的分析处理,且通过EMD分解出的本征模函数(Intrinsic Mode Function, IMF)分量可用于提取特征信息。目前,已有学 者采用计算各MF的能量矩、能量熵、Renyi熵、Shannon熵以及计算IMF矩阵奇异值等方法进行了故障特征提取的研究。皮尔森相关系数一 P xy反映变量之间相关关系密切程度的统计指标,取值在-1到I之间。Pxy=O时,称X、Y不相关;I PxyI=I时,称X、Y完全相关,此时,X、Y之间具有线性函数关系;I P xy I〈I时,X的变动引起Y的部分变动,I P xy I越大,X的变动引起Y的变动就越大,I Pxy I >0.8时称为高度相关,当I Pxy I〈0.3时,称为低度相关,其他为中度相关。分析每个IMF分量与原始数据的相关性,剔除对原始序列影响不大的分量,可以减少计算时间、提高短期断面客流量的预测效率。【权利要求】1.一种基于EMD的断面客流神经网络预测方法,其特征在于,该方法步骤如下: 第一步:获取数据本征模函数分量; 将每日每30分钟间隔时段内OD间的汇总客流量分配到断面客流信息中,形成断面客流量原始序列; 根据数据的特征时间尺度来经验地识别出固有振荡模态,然后据此把一个非平稳信号分解为一系列本征模函数和一个冗余分量之和,即经验模式分解处理得到本征模函数MF分量; 每个IMF分量需满足两个条件: ①过零点的数量与极值点的数量相等或至多相差一个; ②在任一时间点,局部最大值确定的上包络线和局部最小值确定的下包络线的均值为零,即信号关于时间轴局部对称; 第二步:组件识别; 将原始断面客流数据中不同尺度的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列;最低频率的IMF分量代表原始序列的长期趋势或均值,最高频率的IMF分量代表原始序列的短期特征;相关系数Pxy是用以反映变量之间相关关系密切程度的统计指标,相关系数P xy取值在-1到I之间,P xy=o时,称X、Y不相关;I P xy|=l时,称X、Y完全相关,此时,X、Y之间具有线性函数关系;I Pxy I〈I时,X的变动引起Y的部分变动,I Pxy越大,X的变动引起Y的变动就越大,I Pxy I >0.8时称为高度相关,当I Pxy I〈0.3时,称为低度相关,其他为中度相关;这里,采用皮尔森相关系数;2.根据权利要求1所述的一种基于EMD的断面客流神经网络预测方法,其特征在于,所述经验模式分解处理得到本征模函数MF分量方法步骤如下: (I)设原始信号为X (t),找出其所有局部极值点,将所有的局部极大值点和局部极小值点分别用三次样条曲线连接起来,得到x(t)的上、下包络线; 对于一个信号非端点处的数据,通过它与相邻数据的大小关系判断它是否是极值点:如果它同时大于与它左右相邻的数据,即为极大值点;如果它同时小于与它左右相邻的数据,即为极小值点;对于端点处的数据,如果它大于与它相邻那个数据,则它是极大值点;当由于端点非极大(或小)值点,上(或下)包络线在端点处无法确定它的终点值时,如果能够根据极值点序列中端点以内数据的规律得出该序列在端点处的近似取值,则可以防止对极值点进行样条插值得到的包络线出现较大的摆动;取出原极值点序列最左端的三个极值点,如果极大值点序列的个数小于三个则取序列中所有元素,对所取的极值点利用多项式拟合算法求出拟合多项式,计算出多项式对应数据序列左端点处的函数值,把此函数值作为极值点序列在该端点处的近似取值,同理求出极值点序列在右端点处的近似取值;最后利用三次样条函数对新极值点序列进行插值得到上下包络线;虽然多项式拟合只能求出极值点序列在端点处(左、右端点)的近似取值;对极值点序列进行了近似延拓,但是延拓的目的不是为了给出准确的原序列以外的数据,而是提供一种条件,使得包络完全由端点以内的数据确定,所以以上方法对原数据序列的处理,不但抑制了端点效应,而且把其中的主要信息也完整地提取出来; 之中所述多项式拟合算法步骤为: a.确定拟合多项式的次数η; b.计算出Sr和Tr; 3.根据权利要求1所述的一种基于EMD的断面客流神经网络预测方法,其特征在于,分析每个IMF分量与原始数据的相关性,剔除对原始序列影响不大的分量。4.根据权利要求1所述的一种基于EMD的断面客流神经网络预测方法,其特征在于,所述学习速率选为0.01。5.根据权利要求1所述的一种基于EMD的断面客流神经网络预测方法,其特征在于,所述确定动量因子为0.9。`【文档编号】G06N3/02GK103729688SQ201310699959【公开日】2014年4月16日 申请日期:2013年12月18日 优先权日:2013年12月18日 【专利技术者】王子洋, 朱婕, 秦勇, 赵忠信, 钟玲玲, 于鸿飞, 杜渺, 李倩, 李文宇, 朱鹏, 李军, 刘靖, 袁敏正, 丁健隆 申请人:北京交通大学本文档来自技高网...

【技术保护点】
一种基于EMD的断面客流神经网络预测方法,其特征在于,该方法步骤如下:第一步:获取数据本征模函数分量;将每日每30分钟间隔时段内OD间的汇总客流量分配到断面客流信息中,形成断面客流量原始序列;根据数据的特征时间尺度来经验地识别出固有振荡模态,然后据此把一个非平稳信号分解为一系列本征模函数和一个冗余分量之和,即经验模式分解处理得到本征模函数IMF分量;每个IMF分量需满足两个条件:①过零点的数量与极值点的数量相等或至多相差一个;②在任一时间点,局部最大值确定的上包络线和局部最小值确定的下包络线的均值为零,即信号关于时间轴局部对称;第二步:组件识别;将原始断面客流数据中不同尺度的波动或趋势逐级分解开来,产生一系列具有不同特征尺度的数据序列;最低频率的IMF分量代表原始序列的长期趋势或均值,最高频率的IMF分量代表原始序列的短期特征;相关系数ρxy是用以反映变量之间相关关系密切程度的统计指标,相关系数ρxy取值在?1到1之间,ρxy=0时,称X、Y不相关;|ρxy|=1时,称X、Y完全相关,此时,X、Y之间具有线性函数关系;|ρxy|<1时,X的变动引起Y的部分变动,|ρxy|越大,X的变动引起Y的变动就越大,|ρxy|>0.8时称为高度相关,当|ρxy|<0.3时,称为低度相关,其他为中度相关;这里,采用皮尔森相关系数;ρxy=1n-1Σi=1n(Xi-X‾SX)(Yi-Y‾SY),---12)]]>式中:n—样本数量,—样本的平均值,SX,SY—样本标准差;第三步:BP神经网络预测;(1)样本的选取根据组件识别环节中剩余的有效序列,对其进行随机划分,80%为训练集,20%测试集;(2)样本的归一化处理由于采集的各数据单位不一致,因而须对数据进行[?1,1]归一化处理,归一化方法为:X0=(X?Xmin)(Xmax?Xmin),???13)式中:X、X0分别为转换前、后的值,Xmax、Xmin分别为样本的最大值和最小值;(3)BP神经网络构建;(3.1)输入、输出层节点确定;输入层有M个输入节点,分别代表断面客流序列不同的IMF分量;输出层有N个输出节点,分别代表对应的未来的断面客流量;(3.2)隐含层层数以及隐含层节点数确定;所述隐含层层数为单隐层;隐含层节点数公式:n=M+N+a,---14)]]>式中:n为隐含层节点数,M为输入节点数,N为输出节点数,a为0?10之间的常数;(3.3)传递函数选择本专利技术中隐含层传递函数采用Tan?Sigmoid型函数;输出层传递函数采用线性purelin函数;(3.4)学习参数选择①学习速率的确定:所述学习速率的选取范围在0.01?0.8;②动量因子的确定:动量因子的取值范围在0?1之间;(3.5)BP神经网络训练使用LM(Levenberg?Marquardt)算法进行BP神经网络训练;(4)BP神经网络预测将测试数据作为输入层的输入数据,代入到BP神经网络中进行预测,得到输出与真实结果对比分析以及相对误差。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王子洋朱婕秦勇赵忠信钟玲玲于鸿飞杜渺李倩李文宇朱鹏李军刘靖袁敏正丁健隆
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1