【技术实现步骤摘要】
基于Hadoop的并行化BP神经网络的能耗预测方法
[0001]本专利技术属于城市轨道交通能耗预测
,具体地说,是一种基于Hadoop的并行化BP神经网络的能耗预测方法。
技术介绍
[0002]城市轨道交通运营管理过程中,准确预测地铁列车未来周期的能耗,有利于优化地铁的控制策略和日常运行,对地铁能效管理、能源分配提供可靠的数据支持,能持续有效的辅助行业的运行和服务。牵引能耗模型为时间序列模型,随着机器学习及深度学习的进步,对轨道交通牵引能耗的预测方法也在不断拓宽。
[0003]在牵引能耗预测的研究中,在统计分析研究方法层面,有趋势外推法、线性回归、卡尔曼滤波等方法,在机器学习方法层面,通过挖掘历史数据中隐含的信息,实现能耗模型的迭代训练,其中支持向量机、人工神经网络以及决策树、随机森林、贝叶斯网络、小波理论、BP神经网络等都可以对能耗模型进行拟合。
[0004]在对能耗预测的研究中,使用单一的算法模型在实际预测中总会存在一定的局限性。数据异常、模型欠拟合或过拟合都会影响预测模型的精度,并且单一的模型算法 ...
【技术保护点】
【技术特征摘要】
1.一种基于Hadoop的并行化BP神经网络的能耗预测方法,其特征在于,包括以下步骤:步骤1、获取地铁列车及变电站历史统计数据,初步清洗并存储到Hadoop分布式系统中;步骤2、通过Map任务将样本数据进行随机化处理,并按照一定比例将新样本划分为训练样本和测试样本,并分别进行归一化处理;步骤3、将数据划分成小型数据集,存储在分布式文件系统数据各节点中,作为网络训练参数;步骤4、采用灰色关联分析法建立能耗影响因素评估体系,体系中包括对影响因素重要度排序,确定样本数据初始化权值;步骤5、初始化BP神经网络训练参数,包括误差函数与期望误差值,学习速率,输入层、隐含层、输出层神经元节点个数,阈值和权值;步骤6、节点启动Map任务接收训练样本,进行网络训练,计算当前网络连接权值变化量输出中间结果,Reduce操作计算所有权值变化量平均值作为输出,批处理训练网络,调整网络中各层的权重;步骤7、重复步骤(6),直到网络预测相对误差达到初始设定的误差目标或达到初始设定的最大迭代次数。步骤8、根据训练好的并行能耗预测模型对地铁列车能耗进行预测得到预测结果,并与真实值对比,计算准确率。2.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法,其特征在于,步骤1中所述的获取的地铁列车及变电站历史统计数据,具体如下:从轨道交通SCADA系统中获取地铁牵引能耗原始数据,原始数据包括待预测日期之前若干天的地铁列车牵引能耗历史数据,以及客流、运行里程、温度、湿度、开行列次信息的历史数据。3.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法,其特征在于,步骤2所述的将样本数据通过Hadoop中的Map任务进行随机化处理,具体如下:数据样本先按照Hadoop平台提前设置好的分片大小进行分块操作,每一个分块由相互独立的Map任务进行并行处理,通过Hadoop平台的Shuffle机制将原来根据某个属性团簇在一起、数据一致性高于设定的阈值的数据集进行随机打散,随机地下发到下游的Reduce任务中进行重新组合,进而形成多样性高的多个数据块作为新的训练样本。4.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法,其特征在于,步骤2中所述的对训练集数据进行归一化处理,具体如下:数据归一化方法采用Z
‑
score标准化方法,公式如下:其中,x
*
为归一化后的数据,x为个体观测值,μ为训练集数据的均值,δ为训练集数据的标准差。5.根据权利要求1所述的基于Hadoop的并行化BP神经网络的能耗预测方法,其特征在于,步骤4所述的根据灰色关联分析法建立能耗影响评估体系,计算输入输出影响度初...
【专利技术属性】
技术研发人员:胡文斌,姚跃,李华轩,秦建楠,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。