【技术实现步骤摘要】
一种基于气象因子的CA-NARX水质预测方法
本专利技术涉及智能水质预测数据应用
,尤其是一种基于气象因子的CA-NARX水质预测方法,应用于水源地水质预测及管理。
技术介绍
水源地的水质情况与人民生活息息相关,运用科学的方法对水质指标进行预测是一种有效的水资源管理和保护方法。总磷、总氮含量是水体富营养化状态的重要评价指标,也是影响水体环境的重要因素。对水体中总磷、总氮含量的准确快速预测可为水环境的评估与预警提供理论支撑,同时也为相关部门提供决策依据,有助于水环境监控与管理工作的进行,保证居民饮水的安全性。目前,世界上水质预测方面主要有三大方向:从大量的水质历史数据挖掘信息进而预测水质、建立先进准确的水动力数学模型预测水质、通过气象因子数据预测水质。在运用大量历史数据进行水质预测研究方面,AliNajahAhmed等提出了一种以PH值等水质参数历史数据为基础的神经模糊推理系统(WDT-ANFIS),并结合了小波增强去噪进行改进以减少数据误差对预测结果造成的影响;在建立先进准确的水动力数学模型方面,蒋晨韵等构建了三维水动力-水质模型研究气温、水温、风力对蓝藻水华的影响;唐旺等利用三维耦合模型研究了库区水温和水质的相互影响关系。但是对于像中国石河水库这种中小型水库来说,上述从大量的水质历史数据挖掘信息进而预测水质和建立先进准确的水动力数学模型预测水质的方法并不适用。首先,获取大量的历史数据并不容易。我国的中小型水库多是每月采样检测两次,周期长、反应慢,难以实现实时监测从而获取大量数据。其次,引进先进的模型及 ...
【技术保护点】
1.一种基于气象因子的CA-NARX水质预测方法,其特征在于,包括以下步骤:/n步骤1:将逐日水质数据、气象因子数据分别存入矩阵,并对数据进行Min-Max标准化;/n步骤2:根据分类数对应分位数选取初始聚类中心;/n步骤3:根据各样本观测点距初始聚类中心的欧氏距离进行初步聚类;/n步骤4:根据各样本观测点距聚类中心的马氏距离进行按批迭代聚类,直至前后两次迭代的聚类中心欧式距离之差小于某数值;/n步骤5:遍历某范围的聚类数,分别计算每类聚类数下的样本平均轮廓系数值,选取与1相差最小的轮廓系数对应的聚类数,得到最佳聚类情况;/n步骤6:将分类后的气象因子数据和水质数据归一化,并转化为时间序列数据,创建数据集,并初始化输入、输出延时阶数,隐含层个数参数;/n步骤7:采用交叉验证方法,将样本数据随机的分成m份,每次随机的选择m-3份作为训练集,剩下的1份做测试集,2份做验证集,当这一轮完成后,重新随机选择m-3份来训练数据算法,重复进行一定轮数;/n步骤8:创建非线性自回归神经网络,确定训练函数、误差函数;/n步骤9:进行网络训练,计算隐含层、输出层的输出,计算实际输出值与期望输出值的误差; ...
【技术特征摘要】
1.一种基于气象因子的CA-NARX水质预测方法,其特征在于,包括以下步骤:
步骤1:将逐日水质数据、气象因子数据分别存入矩阵,并对数据进行Min-Max标准化;
步骤2:根据分类数对应分位数选取初始聚类中心;
步骤3:根据各样本观测点距初始聚类中心的欧氏距离进行初步聚类;
步骤4:根据各样本观测点距聚类中心的马氏距离进行按批迭代聚类,直至前后两次迭代的聚类中心欧式距离之差小于某数值;
步骤5:遍历某范围的聚类数,分别计算每类聚类数下的样本平均轮廓系数值,选取与1相差最小的轮廓系数对应的聚类数,得到最佳聚类情况;
步骤6:将分类后的气象因子数据和水质数据归一化,并转化为时间序列数据,创建数据集,并初始化输入、输出延时阶数,隐含层个数参数;
步骤7:采用交叉验证方法,将样本数据随机的分成m份,每次随机的选择m-3份作为训练集,剩下的1份做测试集,2份做验证集,当这一轮完成后,重新随机选择m-3份来训练数据算法,重复进行一定轮数;
步骤8:创建非线性自回归神经网络,确定训练函数、误差函数;
步骤9:进行网络训练,计算隐含层、输出层的输出,计算实际输出值与期望输出值的误差;
步骤10:进行权值、阈值更新,重复步骤8~步骤9,直至满足训练结果的平均误差小于某数值;
步骤11:输入相应影响因子数据,通过网络仿真输出总磷、总氮含量预测值。
2.根据权利要求1所述的一种基于气象因子的CA-NARX水质预测方法,其特征在于:步骤1中的逐日水质数据包括总磷、总氮含量;气象因子数据包括气温、水温、降雨量、相对湿度。
3.根据权利要求1所述的一种基于气象因子的CA-NARX水质预测方法,其特征在于:步骤1中具体的Min-Max标准化方法为:将n日的水质数据总磷、总氮含量数据存入矩阵Y=[Y1,Y2],其中Yi=[Y1i,Y2i...Yni]′i=1,2,将四个气象因子气温、水温、降雨量、相对湿度数据存入矩阵X=[X1,X2,X3,X4],其中Xi=[X1i,X2i...Xni]′i=1,2,3,4,分别对两类数据进行Min-Max标准化,具体标准化公式为:
4.根据权利要求1所述的一种基于气象因子的CA-NARX水质预测方法,其特征在于:步骤2中选取初始聚类中心的具体方法为:设聚类数为k,设将样本分为k类,则第h个聚类中心为各变量的分位数,h=1,2...k,以k=3为例,则三个初始聚类中心分别为
5.根据权利要求1所述的一种基于气象因子的CA-NARX水质预测方法,其特征在于:步骤3中进行初步聚类的具体方法为:根据n个观测值距k个聚类中心的欧氏距离进行第一次聚类,设y1,y2,...yn为n个样本,即yi=[Y1i,Yi2,...Yim]′,则第j个样本与第h个聚类中心之间的欧氏距离为:
则分类准则为:
即将观测点归到距聚类中心欧式距离最小的类别。
6.根据权利要求1所述的一种基于气象因子的CA-NARX水质预测方法,其特征在于:步骤4中具体的方法包括如下步骤:
I:设第h类的观测个数为nh,计算每类数据的类均值类内方差∑h,将每类别样本均值...
【专利技术属性】
技术研发人员:王晶,耿燕,章胤,金玉玺,
申请(专利权)人:燕山大学,
类型:发明
国别省市:河北;13
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。