一种基于环保大数据的空气质量监测方法及系统技术方案

技术编号:19594157 阅读:30 留言:0更新日期:2018-11-28 05:08
本发明专利技术涉及空气质量监测领域,公开了一种基于环保大数据的空气质量监测方法及系统,通过获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。提高了空气质量预测的精度及模型的泛化性,加快计算收敛,防止模型过渡训练。

【技术实现步骤摘要】
一种基于环保大数据的空气质量监测方法及系统
本专利技术涉及空气质量监测领域,尤其涉及一种基于环保大数据的空气质量监测方法及系统。
技术介绍
空气质量的好坏由空气中污染物浓度的高低决定,为了检测空气质量,目前通常在特定范围内分布多个固定监测点,其中每个监测点仅用于测量其所在位置的空气质量,而为了得到整个区域较完整的空气质量情况并进行空气质量预测,需要对大数据量的历史数据进行分析建模预测预测空气质量和发展变化趋势。现有技术中,采用BP神经网络进行大气污染预测建模,但是现有技术中的BP神经网络建模方法容易出现收敛速度慢、易陷入局部极小值等缺陷,且泛化能力低。
技术实现思路
本专利技术提供一种基于环保大数据的空气质量监测方法及系统,解决现有技术中BP神经网络建模方法容易出现收敛速度慢、易陷入局部极小值等缺陷,且泛化能力低的技术问题。本专利技术的目的是通过以下技术方案实现的:一种基于环保大数据的空气质量监测方法,包括:获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。一种基于环保大数据的空气质量监测系统,包括:获取模块,用于获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化模块,用于初始化BP人工神经网络的输入层和输出层;优化设置模块,用于对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;预测计算模块,用于根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。本专利技术提供一种基于环保大数据的空气质量监测方法及系统,通过获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。提高了空气质量预测的精度及模型的泛化性,加快计算收敛,防止模型过渡训练。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可根据这些附图获得其他的附图。图1为本专利技术实施例的一种基于环保大数据的空气质量监测方法流程图;图2为本专利技术实施例的一种基于环保大数据的空气质量监测系统的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示,为本专利技术实施例提供的一种基于环保大数据的空气质量监测方法,包括:步骤101、获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;步骤102、初始化BP人工神经网络的输入层和输出层;步骤103、对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;步骤104、根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。其中,步骤101具体可以包括:获取空气质量历史数据样本,按照3:1比例随机分成训练集和验证集。原始数据样本集按3:1随机分成训练集和验证集。其中,训练集数据用来对神经网络进行训练,作初步的模型设定;验证集数据用来监控和调试模型权重,同时也用作模型评估。在样本集划分时,保证选择的随机性,是为了使分开的2部分数据的性质一致。步骤102具体可以包括:步骤102-1、根据所述历史数据的时间跨度,设置BP人工神经网络的输入层为一个或两个神经元;其中,如果历史数据的时间跨度包括多个时间段,可以选择输入层设置两个神经元。当只包括一个时间段时输入层设置一个神经元。步骤102-2、设置BP人工神经网络的输出层为一个神经元。步骤103具体可以包括:步骤103-1、初始化待优化验证的人工神经网络结构及训练算法集,其中,所述训练算法集包括贝叶斯正则化算法、L-M优化算法、带动量的梯度下降法、量化共轭梯度法;其中,对于输入层设置两个神经元的人工神经网络结构可以采用2-4-1(输入层为2个神经元,隐含层为4个神经元,输出层为1个神经元,以下类似)、2-5-1、2-10-1、2-20-1等多种结构进行验证,即不同的隐含层的神经元个数分别进行验证,选择最优结果。步骤103-2、采用均方误差和平均绝对百分比误差对各算法及各种人工神经网络结构的预测性能进行评价,确定BP人工神经网络的最优训练算法及隐含层的神经元个数。其中,通过对各算法及各种人工神经网络结构的计算均方误差MSE和平均绝对百分比误差MAPE,选择误差最小的集合作为BP人工神经网络的最优训练算法及隐含层的神经元个数,其中,计算均方误差MSE和平均绝对百分比误差MAPE的公式如下,xi和yi分别为监测值和预测值:步骤103-2之后还可以包括:步骤103-3根据网络训练误差,确定BP人工神经网络的最优训练次数。其中,在训练初始阶段,验证集的验证误差通常会随着网络训练误差的减小而减小;但是,当网络开始进入过度训练时,验证误差就会增大,当验证误差增大到一定程度时,即达到最佳训练次数时,网络训练提前停止,这时,训练函数会返回当验证误差取最小值时的网络对象。该步骤在训练过程中加入验证集以求找到最佳训练次数,当达到最佳训练次数后,提前终止训练,防止网络被过度训练。本专利技术提供一种基于环保大数据的空气质量监测方法,通过获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。提高了空气质量预测的精度及模型的泛化性,加快计算收敛,防止模型过渡训练。本专利技术实施例还提供了一种基于环保大数据的空气质量监测系统,如图2所示,包括:获取模块210,用于获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化模块220,用于初始化BP人工神经网络的输入层和输出层;优化设置模块230,用于对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;预测计算模块240,用于根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。其中,所述获取模块210具体用于获取空气质量历史数据样本,按照3:1比例随机分成训练集和验证集。所述初始化模块220,包括:输入层设置单元221,用于根据所述历史数据的时间跨度,设置BP人工神经网络的输入层为一个或两个神经元;输出层设置单元222,用于设置BP人工神经网络的输出层为一个神经元。所述优化设置模块230,包括:初始配置单元231,用于初始化待优化验证的人工神经网络结构本文档来自技高网...

【技术保护点】
1.一种基于环保大数据的空气质量监测方法,其特征在于,包括:获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。

【技术特征摘要】
1.一种基于环保大数据的空气质量监测方法,其特征在于,包括:获取空气质量历史数据,并对所述历史数据进行数据划分,以获取训练集和验证集;初始化BP人工神经网络的输入层和输出层;对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数,其中,所述隐含层参数为神经元数目;根据所述最优训练算法及隐含层参数,对未来空气质量进行预测。2.根据权利要求1所述的基于环保大数据的空气质量监测方法,其特征在于,所述获取空气质量历史数据,并对所述历史数据进行数据划分的步骤,包括:获取空气质量历史数据样本,按照3:1比例随机分成训练集和验证集。3.根据权利要求1所述的基于环保大数据的空气质量监测方法,其特征在于,所述初始化BP人工神经网络的输入层和输出层的步骤,包括:根据所述历史数据的时间跨度,设置BP人工神经网络的输入层为一个或两个神经元;设置BP人工神经网络的输出层为一个神经元。4.根据权利要求1所述的基于环保大数据的空气质量监测方法,其特征在于,所述对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数的步骤,包括:初始化待优化验证的人工神经网络结构及训练算法集,其中,所述训练算法集包括贝叶斯正则化算法、L-M优化算法、带动量的梯度下降法、量化共轭梯度法;采用均方误差和平均绝对百分比误差对各算法及各种人工神经网络结构的预测性能进行评价,确定BP人工神经网络的最优训练算法及隐含层的神经元个数。5.根据权利要求4所述的基于环保大数据的空气质量监测方法,其特征在于,所述对预测性能及隐含层参数进行计算评估,以确定BP人工神经网络的最优训练算法及隐含层参数的步骤之后,还包括:根据网络训练误差...

【专利技术属性】
技术研发人员:白辉建
申请(专利权)人:深圳市源广浩电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1