【技术实现步骤摘要】
基于机器学习算法对废气处理率进行预测的方法及系统
[0001]本专利技术涉及废气处理
,尤其是指一种基于机器学习算法对废气处理率进行预测的方法及系统。
技术介绍
[0002]废气处理主要是指针对工业场所产生的工业废气诸如粉尘颗粒物、烟气烟尘、异味气体、有毒有害气体进行治理的工作。常见的废气处理有工厂烟尘废气净化、车间粉尘废气净化、有机废气净化、废气异味净化、酸碱废气净化、化工废气净化等。常用的方法有水吸收法、曝气式活性污泥脱臭法、多介质催化氧化工艺,由于废气对空气的污染非常严重,因此,环保部门制定了严格的要求,要求废气处理达标后才能进行排放。但是目前缺少对废气处理率进行预测的方法,导致企业在废气处理前无法对废气处理率进行预测,容易发生废气排放不达标的问题,如此空气污染问题依然困扰着很多企业。
[0003]因此,迫切需要寻求一种基于机器学习算法对废气处理率进行预测的方法,以便企业在废气处理前能够对废气处理率进行预测,有效避免废气排放不达标的问题。
技术实现思路
[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中因在废气处理前无法对废气处理率进行预测而导致的废气排放不达标的问题。
[0005]为解决上述技术问题,本专利技术的一个目的提供了一种基于机器学习算法对废气处理率进行预测的方法,包括:
[0006]采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将所述预测样本第一浓度通过K
‑
means聚类算法进行分类,得到预测样本分类标签 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习算法对废气处理率进行预测的方法,其特征在于,包括:采集预测样本,预测样本包括预测样本第一浓度和预测样本处理时间,将所述预测样本第一浓度通过K
‑
means聚类算法进行分类,得到预测样本分类标签;将所述预测样本分类标签、预测样本第一浓度与预测样本处理时间进行整理,得到整理过后的预测样本;根据所述整理过后的预测样本,利用机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度;根据所述预测样本第二浓度计算出废气处理率。2.根据权利要求1所述的基于机器学习算法对废气处理率进行预测的方法,其特征在于:将所述预测样本第一浓度通过K
‑
means聚类算法进行分类包括:在预测样本第一浓度的数据集中随机选取k个预测样本数据作为起始的聚类中心μ
i
,其中k=3,聚类中心分别为μ1、μ2和μ3,μ1、μ2和μ3分别表示高浓度、中浓度和低浓度;分别计算数据集中每个预测样本数据x
i
到3个聚类中心的距离,计算公式为:式中,μ
i
为聚类中心,x
j
为预测样本数据,j为预测样本数据索引;根据计算得到的距离将预测样本数据x
j
划分至距离最近的聚类中心,使用欧拉公式重新计算聚类中心,欧拉公式为:其中x
i
,x
j
为两条离散的预测样本数据,x
iu
、x
ju
分别为x
i
、x
j
在字段索引u上的取值;重复所述聚类过程,直至算法收敛,得到聚类结果。3.根据权利要求1所述的基于机器学习算法对废气处理率进行预测的方法,其特征在于:根据所述整理过后的预测样本,基于机器学习算法GBDT得到预测样本的预测结果,即预测样本第二浓度包括:采集训练样本,训练样本包括训练样本分类标签、训练样本第一浓度、训练样本处理时间和训练样本第二浓度;将所述训练样本整理为训练集样本,记为T={(x1,y1),(x2,y2),...,(x
i
,y
i
)},其中x
i
为训练数据的输入值,y
i
为训练数据的输出值,i为数据索引;输入训练数据集T、损失函数L及最大迭代次数t,其中损失函数为L(y,f(x));对弱学习器F0(x)进行初始化,式中c为常数,y
i
为训练数据的输出值,i为数据索引,N为数据的个数;通过t次迭代计算更新强学习器F
n
(x),输出...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。