一种二噁英排放浓度预测方法技术

技术编号：24459331 阅读：48 留言：0更新日期：2020-06-10 16:31

本发明专利技术公开一种基于随机森林和梯度提升树混合集成的二噁英排放浓度预测方法，首先，针对具有小样本高维特性的DXN建模数据进行训练样本和输入特征的随机采样以生成训练子集；接着，基于训练子集建立J个基于RF的DXN子模型；然后，对每个基于RF的DXN子模型进行I次迭代，构建J×I个基于GBDT的DXN子模型；最后，对基于RF和GBDT的DXN子模型的预测输出采用简单平均加权方式进行合并，获得最终输出。采用集成RF和GBDT的DXN预测模型构建方法能够提高DXN在线预测精度，辅助进行MSWI过程操作参数的运行优化，提高企业经济效益。

A prediction method of dioxin emission concentration

全部详细技术资料下载

【技术实现步骤摘要】
一种二噁英排放浓度预测方法
本专利技术属于城市固废焚烧
，尤其涉及一种基于随机森林和梯度提升树混合集成的二噁英排放浓度预测方法。
技术介绍
经济的迅速发展和城市化建设的不断升级使得我国城市固体废物(MSW)的产生量迅速增加，特别是在经济发达和人口密集的地区，某些城市正面临着垃圾围城危机[1]。城市固体废物焚烧(MSWI)发电是实现垃圾减量化、资源化、无害化的典型处理方式[2]。目前国内MSWI发电厂数量已超过300座，炉排炉式焚烧炉占比超过了2/3[3]。由于我国垃圾组分的特殊性，导致引进的焚烧设备多处于人工手动控制运行状态，常出现“水土不服”的现象，同时造成了MSWI排放不合标等问题[4]。针对这种现象，最为紧要的问题是：如何在满足经济效益的情况下控制MSWI过程的污染排放[5]。二噁英(DXN)作为MSWI排放的一种具有极强化学性和热稳定性的剧毒持久性有机污染物，是造成焚烧建厂出现“邻避效应”的主要原因之一[6]。在实际工业过程中，主要通过在线采样与离线实验分析相结合的方法按照一定的周期进行DXN排放浓度检测[3]，但该方式成本昂贵且周期比较长，主要问题是：难以支撑MSWI运行参数的实时优化控制以达到使DXN排放浓度最小化的目的[7]。因此，实现DXN排放浓度的在线预测非常必要。MSWI过程具有复杂的物理和化学特性，难以建立DXN排放浓度的精确机理模型[8]。DXN排放浓度的在线预测是实现MSWI过程优化控制必不可少的重要环节[9]。针对DXN的在线检测研究，目前多是先进行相关关联物的测量再通过映射...

【技术保护点】
1.一种二噁英排放浓度预测方法，其特征在于，包括以下步骤：/n步骤1、通过训练样本与输入特征随机采样模块，对训练样本集{X∈R

【技术特征摘要】
1.一种二噁英排放浓度预测方法，其特征在于，包括以下步骤：
步骤1、通过训练样本与输入特征随机采样模块，对训练样本集{X∈RN×M,y∈RN×1}进行有放回的N次随机采样并随机选择固定数量的输入特征，生成训练子集其中，表示与采集DXN化验样品同时段的MSWI过程的炉膛温度、活性炭喷射量、烟囱排放气体浓度、炉排速度、一次风\二次风流量由过程控制系统所采集的过程变量所组成的输入数据，其中N为训练样本数量，M为过程变量数量；表示在MSWI过程末端，即在烟囱排放处进行在线采集离线化验的DXN排放浓度组成的输出数据；
步骤2、通过基于RF的DXN子模型构建模块，利用生成的训练子集建立基于RF的DXN子模型将DXN排放浓度预测值与测量值进行相减，得到预测误差
步骤3、通过基于GBDT的DXN子模型构建模块，以输出的误差作为输出数据真值，和训练子集输入数据组成新的训练子集针对每个训练子集进行I次迭代后，构建I×J个基于GDBT的DXN子模型
步骤4、通过基于简单平均的DXN集成预测模块，将基于RF的DXN子模型和基于GBDT的DXN子模型进行简单平均，建立最终的DXN排放浓度预测模型。

2.如权利要求1所述的二噁英排放浓度预测方法，其特征在于，所述训练样本与输入特征随机采样模块的具体工作过程为：
采用自助采样法(Bootstrap)与随机子空间法(RSM)对MSWI过程数据进行处理，利用Bootstrap抽取与训练样本子集的样本数量相同的训练子集，随后引入RSM机制随机选择部分特征，最终生成包含N个样本和Mj个特征的J个训练子集，
训练子集的产生过程可表示为：

其中，{Xj,yj}表示第jth个训练子集；表示第jth个训练子集的第nth个输入和输出样本对；m＝1,L,Mj，Mj表示第jth个训练子集所包含的输入特征数量，通常存在Mj<<M。

3.如权利要求2所述的二噁英排放浓度预测方法，其特征在于，所述基于RF的DXN子模型构建模块的具体工作过程为：
以第jth个训练子集为例描述构建过程，
首先去除因随机采样造成的训练子集中所存在的重复样本，并将其标记为以第mth个输入特征xj,m作为切分变量，以第nselth个样本所对应的值作为切分点，将输入特征空间切分为两个区域R1和R2，

基于以下准则遍历寻找最佳切分变量编号和切分点取值，

其中，和分别表示第jth个训练子集在R1和R2区域的DXN排放浓度的测量值；C1和C2分别表示在R1和R2两个区域的DXN排放浓度测量值的均值，
基于上述准则，首先通过遍历所有输入特征找到最优切分变量编号和切分点的取值，并将输入特征空间划分为两个区域；然后对每个区域重复上述过程，直到叶子点所包含的训练样本数量少于预先设定的阈值θRF；最终将输入特征空间划分为K个区域，将这些区域分别标记为R1,L,Rk,L,RK，所述K也表示CART回归树的叶子节点数，
采用CART回归树构建的基于RF的DXN子模型可表示为：

其中，

其中，表示区域Rk所...

【专利技术属性】
技术研发人员：汤健，夏恒，乔俊飞，郭子豪，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人