基于虚拟样本改进极限学习机的人工湿地水质预测方法技术

技术编号:35146258 阅读:20 留言:0更新日期:2022-10-05 10:23
基于虚拟样本改进极限学习机的人工湿地水质预测方法,涉及环境管理技术领域,针对现有技术中水质预测精度低的问题,本申请耦合了虚拟样本生成技术和水质预测模型,相比原始预测结果,误差减小60%左右,是通过对以往人工湿地污水处理数据进行训练的结果,在设计阶段预测人工湿地出水水质,提高了水质预测的精度。通过虚拟样本的生成和添加,丰富原始样本集的信息,弥补原始数据数量少、预测模型误差大的不足。本申请有助于预知人工湿地效果是否能达到标准,使得对建设参数和入水水质和出水水质的协调调控高效进行,节约试错成本。节约试错成本。节约试错成本。

【技术实现步骤摘要】
基于虚拟样本改进极限学习机的人工湿地水质预测方法


[0001]本专利技术涉及环境管理
,具体为基于虚拟样本改进极限学习机的人工湿地水质预测方法。

技术介绍

[0002]湿地是世界上最具生产力的生态系统,被誉为“地球之肾”和“物种基因库”,是生物生存发展的重要基础。建设人工湿地既是保护城市湿地资源的重要途径,同时也是净化城市水系提升城市水质的有效方法。随着人工湿地建设不断加快,在设计阶段对人工湿地效果进行预测是保障湿地净化功能的重要手段,但传统的人工湿地设计方法,无法科学、准确地得出预估结果。当前,鉴于机器学习方法对数据有良好得学习能力,人工湿地效果出水水质预测方法正从时间序列模型、回归分析、灰色系统理论等转化为机器学习方法。然而,现有的机器学习方法对于水质预测普遍存在预测精度低、鲁棒性不强等问题,不能很好满足对人工湿地系统前期设计工作中水质预测精度要求。

技术实现思路

[0003]本专利技术的目的是:针对现有技术中水质预测精度低的问题,提出基于虚拟样本改进极限学习机的人工湿地水质预测方法。
[0004]本专利技术为了解决上述技术问题采取的技术方案是:
[0005]基于虚拟样本改进极限学习机的人工湿地水质预测方法,所述预测方法基于最终出水水质预测模型实现,所述最终出水水质预测模型构建方法为:
[0006]步骤一:获取人工湿地建设数据和水质数据;
[0007]所述人工湿地建设数据包括水力负荷、滤料厚度、人工湿地类型以及喂养方式;
[0008]所述人工湿地类型包括垂直流和水平流;
[0009]所述喂养方式包括连续喂养和间隔喂养;
[0010]所述水质数据包括进水进水COD、出水和出水COD;
[0011]将进水进水COD、水力负荷、滤料厚度、人工湿地类型以及喂养方式作为输入指标,将出水和出水COD作为输出指标构建原始样本集,将原始样本集划分为训练集和测试集,并利用训练集和测试集构建出水水质预测模型;
[0012]步骤二:利用多分布整体趋势扩散技术扩大输入指标的范围边界,生成输入指标的虚拟点,将生成的输入指标的虚拟点输入出水水质预测模型中,得到输出虚拟点;
[0013]步骤三:利用粒子群优化算法对输入指标的虚拟点以及输出虚拟点进行非线性约束筛选,得到样本点,并将其作为虚拟样本;
[0014]步骤四:将虚拟样本添加至原始样本集中的训练集中,并利用添加后的训练集训练出水水质预测模型,得到最终出水水质预测模型。
[0015]进一步的,所述出水水质预测模型为极限学习机。
[0016]进一步的,所述构建出水水质预测模型的具体步骤为:
[0017]步骤1、数据预处理:
[0018]首先判断原始样本集中是否存在缺失的数据,若存在缺失的数据,则针对输入指标缺失数据,利用岭回归算法构建无缺失的输入间的回归关系,并利用回归关系对输入指标缺失数据进行填充;
[0019]针对输出指标缺失数据,利用无缺失数据训练得到出水水质预测模型,然后将输出缺失数据对应的输入指标数据输入出水水质预测模型,得到输出指标数据;
[0020]步骤2、模型参数寻优:
[0021]采用试凑法确定激活函数下神经元数量的取值,然后得到不同神经元对应的误差,最后选取误差最小时的激活函数和神经元数作为模型参数,并根据模型参数构建模型。
[0022]进一步的,所述激活函数为sigmoid、Gaussian、sin和purelin中一个或多个。
[0023]进一步的,所述神经元数量的取值为16

25。
[0024]进一步的,所述步骤二中生成输入指标的虚拟点,将生成的输入指标的虚拟点输入出水水质预测模型中,得到输出虚拟点的具体步骤为:
[0025]步骤二一:获取原始样本集的数据中心点CL,表示为:
[0026]CL=(max+min)/2
[0027]其中,max表示当前输入指标的最大值,min表示当前输入指标的最小值;
[0028]步骤二二:获取数据中心点CL的左偏度S
KL
、右偏度S
KR
和方差表示为:
[0029][0030][0031][0032]其中,N
L
表示当前输入指标原始样本值小于中心点CL的样本个数,N
R
表示当前输入指标原始样本值大于中心点CL的样本个数,x
i
表示当前输入指标的第i个原始样本值,表示当前输入指标原始样本平均值,m表示当前输入指标原始样本个数,i表示当前输入指标原始样本的次序,i为1到m的正整数;
[0033]步骤二三:根据数据中心点CL的左偏度S
KL
、右偏度S
JR
和方差得到可接受范围上下界,表示为:
[0034][0035][0036]其中,LB表示可接受范围下界,RB表示可接受范围上界;
[0037]步骤二四:根据可接受范围上下界得到生成虚拟点总数m
vir
,表示为:
[0038]m
vir
=m
L
+m
LR
+m
R
[0039]其中,m
L
表示(LB,min)范围生成的虚拟点数量,m
LR
表示(min,max)范围生成的虚拟点数量,m
R
表示(max,RB)范围生成的虚拟点数量;
[0040]步骤二五:根据生成虚拟点总数m
vir
生成输入指标虚拟点x
m
和输出指标虚拟点y
m
,具体步骤为:
[0041]在扩展范围内采用均匀分布方式生成虚拟点x
m1
,表示为:
[0042][0043]在直接观测范围内采用三角分布方式生成虚拟点x
m2
,表示为:
[0044][0045]其中,s表示服从(0,1)范围内均匀分布的随机数,
[0046]将虚拟点x
m1
和x
m2
进行合并,组成输入指标虚拟点x
m

[0047]基于构建的出水水质预测模型,将输入指标虚拟点x
m
作为模型输入,生成与之对应的输出指标虚拟点y
m

[0048]进一步的,所述m
L
表示为:
[0049][0050]进一步的,所述m
lR
表示为:
[0051][0052]进一步的,所述m
R
表示为:
[0053][0054]进一步的,所述步骤三的具体步骤为:
[0055]对输入指标虚拟点x
m
和输出指标虚拟点y
m
进行粒子群优化,得到最优解,并将最优解作为一组虚拟样本。
[0056]本专利技术的有益效果是:
[0057]本申请耦合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述预测方法基于最终出水水质预测模型实现,所述最终出水水质预测模型构建方法为:步骤一:获取人工湿地建设数据和水质数据;所述人工湿地建设数据包括水力负荷、滤料厚度、人工湿地类型以及喂养方式;所述人工湿地类型包括垂直流和水平流;所述喂养方式包括连续喂养和间隔喂养;所述水质数据包括进水进水COD、出水和出水COD;将进水进水COD、水力负荷、滤料厚度、人工湿地类型以及喂养方式作为输入指标,将出水和出水COD作为输出指标构建原始样本集,将原始样本集划分为训练集和测试集,并利用训练集和测试集构建出水水质预测模型;步骤二:利用多分布整体趋势扩散技术扩大输入指标的范围边界,生成输入指标的虚拟点,将生成的输入指标的虚拟点输入出水水质预测模型中,得到输出虚拟点;步骤三:利用粒子群优化算法对输入指标的虚拟点以及输出虚拟点进行非线性约束筛选,得到样本点,并将其作为虚拟样本;步骤四:将虚拟样本添加至原始样本集中的训练集中,并利用添加后的训练集训练出水水质预测模型,得到最终出水水质预测模型。2.根据权利要求1所述的基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述出水水质预测模型为极限学习机。3.根据权利要求2所述的基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述构建出水水质预测模型的具体步骤为:步骤1、数据预处理:首先判断原始样本集中是否存在缺失的数据,若存在缺失的数据,则针对输入指标缺失数据,利用岭回归算法构建无缺失的输入间的回归关系,并利用回归关系对输入指标缺失数据进行填充;针对输出指标缺失数据,利用无缺失数据训练得到出水水质预测模型,然后将输出缺失数据对应的输入指标数据输入出水水质预测模型,得到输出指标数据;步骤2、模型参数寻优:采用试凑法确定激活函数下神经元数量的取值,然后得到不同神经元对应的误差,最后选取误差最小时的激活函数和神经元数作为模型参数,并根据模型参数构建模型。4.根据权利要求3所述的基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述激活函数为sigmoid、Gaussian、sin和purelin中一个或多个。5.根据权利要求4所述的基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述神经元数量的取值为16

25。6.根据权利要求5所述的基于虚拟样本改进极限学习机的人工湿地水质预测方法,其特征在于所述步骤二中生成输入指标的虚拟点,将生成的输入指标的虚拟点输入出水水质预测模型中,得到输出虚拟点的具体步骤为:步骤二一:获取原始样本集的数据中心点CL,表示为:CL=(max+min)/2
其中,max表示当前输入指标的最大值,min表示当前输入指标的最小值;步骤二二:获取数据中心点CL的左偏度S
KL
、右偏度S
K...

【专利技术属性】
技术研发人员:白舜文董琪宇张松丁杰杨珊珊任南琪
申请(专利权)人:江苏河长智库科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1