当前位置: 首页 > 专利查询>陈晓娟专利>正文

基于机器学习算法对废气处理率进行预测的方法及系统技术方案

技术编号:34759369 阅读:21 留言:0更新日期:2022-08-31 18:57
本发明专利技术涉及一种基于机器学习算法对废气处理率进行预测的方法,包括采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将预测样本第一浓度通过K

【技术实现步骤摘要】
基于机器学习算法对废气处理率进行预测的方法及系统


[0001]本专利技术涉及废气处理
,尤其是指一种基于机器学习算法对废气处理率进行预测的方法及系统。

技术介绍

[0002]废气处理主要是指针对工业场所产生的工业废气诸如粉尘颗粒物、烟气烟尘、异味气体、有毒有害气体进行治理的工作。常见的废气处理有工厂烟尘废气净化、车间粉尘废气净化、有机废气净化、废气异味净化、酸碱废气净化、化工废气净化等。常用的方法有水吸收法、曝气式活性污泥脱臭法、多介质催化氧化工艺,由于废气对空气的污染非常严重,因此,环保部门制定了严格的要求,要求废气处理达标后才能进行排放。但是目前缺少对废气处理率进行预测的方法,导致企业在废气处理前无法对废气处理率进行预测,容易发生废气排放不达标的问题,如此空气污染问题依然困扰着很多企业。
[0003]因此,迫切需要寻求一种基于机器学习算法对废气处理率进行预测的方法,以便企业在废气处理前能够对废气处理率进行预测,有效避免废气排放不达标的问题。

技术实现思路

[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中因在废气处理前无法对废气处理率进行预测而导致的废气排放不达标的问题。
[0005]为解决上述技术问题,本专利技术的一个目的提供了一种基于机器学习算法对废气处理率进行预测的方法,包括:
[0006]采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将所述预测样本第一浓度通过K

means聚类算法进行分类,得到预测样本分类标签
[0007]将所述预测样本分类标签、预测样本第一浓度与预测样本处理时间进行整理,得到整理过后的预测样本;
[0008]根据所述整理过后的预测样本,利用机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度;
[0009]根据所述预测样本第二浓度计算出废气处理率。
[0010]在本专利技术的一个实施例中,将所述预测样本第一浓度通过K

means聚类算法进行分类包括:
[0011]在预测样本第一浓度的数据集中随机选取k个预测样本数据作为起始的聚类中心μ
i
,其中k=3,聚类中心分别为μ1、μ2和μ3,μ1、μ2和μ3分别表示高浓度、中浓度和低浓度;
[0012]分别计算数据集中每个预测样本数据x
i
到3个聚类中心的距离,计算公式为:式中,μ
i
为聚类中心,x
j
为预测样本数据,j为预测样本数据索引;
[0013]根据计算得到的距离将预测样本数据x
j
划分至距离最近的聚类中心,使用欧拉公
式重新计算聚类中心,欧拉公式为:其中x
i
,x
j
为两条离散的预测样本数据,x
iu
、x
ju
分别为x
i
、x
j
在字段索引u上的取值;
[0014]重复所述聚类过程,直至算法收敛,得到聚类结果。
[0015]在本专利技术的一个实施例中,根据所述整理过后的预测样本,基于机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度包括:
[0016]采集训练样本,训练样本包括训练样本分类标签、训练样本第一浓度、训练样本处理时间和训练样本第二浓度;
[0017]将所述训练样本整理为训练集样本,记为T={(x1,y1),(x2,y2),...,(x
i
,y
i
)},其中x
i
为训练数据的输入值,y
i
为训练数据的输出值,i为数据索引;
[0018]输入训练数据集T、损失函数L及最大迭代次数t,其中损失函数为L(y,f(x));
[0019]对弱学习器F0(x)进行初始化,式中c为常数,y
i
为训练数据的输出值,i为数据索引,N为数据的个数;
[0020]通过t次迭代计算更新强学习器F
n
(x),输出强学习器F
N
(x)的表达式,得到预测样本第二浓度。
[0021]在本专利技术的一个实施例中,通过t次迭代计算更新强学习器F
n
(x),输出强学习器F
N
(x)的表达式,得到预测样本第二浓度包括:
[0022]对样本i=1,2,...,N,计算负梯度r
n,i
,式中i为数据索引,F(x)为学习器得到的预测值,L(y,f(x))为损失函数,m为分类回归树索引;
[0023]利用CART回归树拟合数据(x
i
,r
n,i
),得到第n棵回归树,其对应的叶子节点区域为R
n,j
,其中j=1,2,...,J
n
,J
n
为第n棵回归树叶子节点的个数;
[0024]对于J
n
个叶子节点区域j=1,2,...,J
n
,计算最佳拟合值c
n,j
,式中F(x)为学习器得到的预测值,L(y,f(x))为损失函数,c为常数,R
n,j
为叶子节点区域;
[0025]更新强学习器F
n
(x),式中c
m,j
为最佳拟合值,R
m,j
为叶子节点区域,I为指示函数;
[0026]输出强学习器F
N
(x)的表达式:式中F0(x)为初始化的弱学习器,m为分类回归树索引,M为最大树索引,j=1,2,...,J
m
,J
m
为第m棵回归树叶子节点的个数,c
m,j
为最佳拟合值,I为指示函数;
[0027]得到预测样本第二浓度。
[0028]在本专利技术的一个实施例中,根据所述预测样本第二浓度计算出废气处理率的计算公式如下:
[0029][0030]式中,s0为预测样本第二浓度,s为预测样本第一浓度,A为废气处理率。
[0031]本专利技术的另一目的提供了一种基于机器学习算法对废气处理率进行预测的系统,包括:
[0032]采集模块,所述采集模块用于采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将所述预测样本第一浓度通过K

means聚类算法进行分类,得到预测样本分类标签;
[0033]整理模块,所述整理模块用于将所述预测样本分类标签、预测样本第一浓度与预测样本处理时间进行整理,得到整理过后的预测样本;
[0034]预测模块,所述预测模块用于根据所述整理过后的预测样本,利用机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度;
[0035]计算模块,所述计算模块用于根据所述预测样本第二浓度计算出废气处理率。
[0036]本专利技术的上述技术方案相比现有技术具有以下优点:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习算法对废气处理率进行预测的方法,其特征在于,包括:采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将所述预测样本第一浓度通过K

means聚类算法进行分类,得到预测样本分类标签;将所述预测样本分类标签、预测样本第一浓度与预测样本处理时间进行整理,得到整理过后的预测样本;根据所述整理过后的预测样本,利用机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度;根据所述预测样本第二浓度计算出废气处理率。2.根据权利要求1所述的基于机器学习算法对废气处理率进行预测的方法,其特征在于:将所述预测样本第一浓度通过K

means聚类算法进行分类包括:在预测样本第一浓度的数据集中随机选取k个预测样本数据作为起始的聚类中心μ
i
,其中k=3,聚类中心分别为μ1、μ2和μ3,μ1、μ2和μ3分别表示高浓度、中浓度和低浓度;分别计算数据集中每个预测样本数据x
i
到3个聚类中心的距离,计算公式为:式中,μ
i
为聚类中心,x
j
为预测样本数据,j为预测样本数据索引;根据计算得到的距离将预测样本数据x
j
划分至距离最近的聚类中心,使用欧拉公式重新计算聚类中心,欧拉公式为:其中x
i
,x
j
为两条离散的预测样本数据,x
iu
、x
ju
分别为x
i
、x
j
在字段索引u上的取值;重复所述聚类过程,直至算法收敛,得到聚类结果。3.根据权利要求1所述的基于机器学习算法对废气处理率进行预测的方法,其特征在于:根据所述整理过后的预测样本,基于机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度包括:采集训练样本,训练样本包括训练样本分类标签、训练样本第一浓度、训练样本处理时间和训练样本第二浓度;将所述训练样本整理为训练集样本,记为T={(x1,y1),(x2,y2),...,(x
i
,y
i
)},其中x
i
为训练数据的输入值,y
i
为训练数据的输出值,i为数据索引;输入训练数据集T、损失函数L及最大迭代次数t,其中损失函数为L(y,f(x));对弱学习器F0(x)进行初始化,式中c为常数,y
i
为训练数据的输出值,i为数据索引,N为数据的个数;通过t次迭代计算更新强学习器F
n
(x),输出...

【专利技术属性】
技术研发人员:陈晓娟
申请(专利权)人:陈晓娟
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1