【技术实现步骤摘要】
一种基于极端梯度提升算法的污水处理过程软测量方法
本专利技术属于工业污水处理过程软测量建模和应用领域,具体涉及一种基于极端梯度提升算法的污水处理过程出水水质参数浓度的软测量方法。
技术介绍
随着社会经济的进步和发展,人类对水环境的污染日益加剧,污水的高效处理对于可持续发展有着越来越重要的意义。水质参数中氨氮的浓度是衡量水质是否达到国家排放标准的重要指标,然而目前针对水质中氨氮浓度的测定方法操作繁琐,实时性不高,而相关的仪器仪表售价昂贵且维护成本较高,因此通常需要研究出水氨氮浓度的软测量方法以满足工业过程控制需要。针对上述问题,采用基于数据驱动的智能化软测量方法,选择可以实时测量的水质参数作为辅助变量,建立出水氨氮浓度的软测量模型,可以实现对出水氨氮浓度进行在线预测,有效避免传统方法的时滞性的缺点。极端梯度提升算法具有模型可解释性好,输入数据不变性强和更易于调整参数等优点,将其用于对污水处理过程中出水氨氮浓度的软测量能够快速得到准确、鲁棒和解释性强的模型。
技术实现思路
针对污水处理过程中出 ...
【技术保护点】
1.一种基于极端梯度提升算法的污水处理过程软测量方法,其特征在于,包括以下步骤:/n(1)采集一批污水处理过程中的生产数据,建立用于缺失数据填充的邻近算法模型;/n(2)通过数据库收集污水处理过程中能在线测量的变量值,作为软测量建模样本的输入量,离线测量所得的出水氨氮浓度值,作为软测量建模样本的输出量,组成软测量建模样本集X=[x
【技术特征摘要】
1.一种基于极端梯度提升算法的污水处理过程软测量方法,其特征在于,包括以下步骤:
(1)采集一批污水处理过程中的生产数据,建立用于缺失数据填充的邻近算法模型;
(2)通过数据库收集污水处理过程中能在线测量的变量值,作为软测量建模样本的输入量,离线测量所得的出水氨氮浓度值,作为软测量建模样本的输出量,组成软测量建模样本集X=[x1,x2,…,xi,…,xn]T,X∈Rn×m,xi是1×m维的行向量,表示第i个样本,i=1,2,…n,n为样本总数,m为过程变量总数,R为实数集;
(3)使用步骤(1)得到的邻近算法模型对软测量建模样本集X进行缺失值的预测和填充,将处理后的软测量建模样本集分为两个数据集,为软测量建模的训练数据集,N1为训练数据集的组数,Ak是1×d维的行向量,为软测量建模样本的一组输入量,是Ak对应的训练样本数据的真实值,k=1,2,…,N1,d为每组输入量的维数;为软测量建模的测试数据集,N2为测试数据集的组数,Bk是1×d维的行向量,为软测量建模样本的一组输入量,yk是Bk对应的测试数据的真实值,k=1,2,…,N2;d+1=m,N1+N2=n;
(4)使用网格搜索法寻找极端梯度提升算法中各参数的最优值;
(5)获得最优参数后,建立软测量模型;采集新的数据集N3为新数据集的组数,Ck是1×d维的行向量,k=1,2,…,N3,将输入基于极端梯度提升算法的污水处理过程出水氨氮浓度的软测量模型中,得到实时的出水氨氮浓度值是对应Ck的软测量模型输出值;
其中,所述步骤(1)中建立用于缺失数据填充的邻近算法模型的具体操作步骤如下:
①采集一批污水处理过程中的生产数据,构成建立最优邻近算法模型的数据集,将数据集中的数值型属性列进行数据归一化处理,以满足邻近模型支持的数据格式;
②将归一化处理后的数据随机拆分为建模数据集和验证数据集;
③设定邻近模型参数α的区间,基于建模数据集和不同的邻近模型参数α,构建邻近模型簇Λ;
④将验证数据集剔除特定属性列数据,构建缺失值数据和缺失值矩阵,带入到模型中得到预测数据集;
⑤利用模型优化目标函数筛选最优邻近模型,由于污水处理过程中参数数据缺失值类型为数值型数据,目标函数S为
其中p表示验证集的数据样本数,gf表示验证集中每个样本在缺失值数据列的真实值,为gf对应的模型填充值,ε为平滑因子;
⑥基于验证数据集的原始数据和预测数据,依据模型优化目标函数对邻近模型簇筛选得到最优邻近模型Λbest;
所述步骤(4)使用网格搜索法进行寻找极端梯度提升算法中各参数最优值的具体操作步骤如下:
①设置7个参数初始搜索范围为eta∈[0.1,1],n_estimators∈[50,800],max_depth∈[1,15],min_child_weight∈[1,5],gamma∈[0,1],subsample∈[0,1],colsample_bytree∈[0,1],搜索步长分别为eat:0.1,n_esti...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。