一种二噁英排放浓度预测方法技术

技术编号:24459331 阅读:48 留言:0更新日期:2020-06-10 16:31
本发明专利技术公开一种基于随机森林和梯度提升树混合集成的二噁英排放浓度预测方法,首先,针对具有小样本高维特性的DXN建模数据进行训练样本和输入特征的随机采样以生成训练子集;接着,基于训练子集建立J个基于RF的DXN子模型;然后,对每个基于RF的DXN子模型进行I次迭代,构建J×I个基于GBDT的DXN子模型;最后,对基于RF和GBDT的DXN子模型的预测输出采用简单平均加权方式进行合并,获得最终输出。采用集成RF和GBDT的DXN预测模型构建方法能够提高DXN在线预测精度,辅助进行MSWI过程操作参数的运行优化,提高企业经济效益。

A prediction method of dioxin emission concentration

【技术实现步骤摘要】
一种二噁英排放浓度预测方法
本专利技术属于城市固废焚烧
,尤其涉及一种基于随机森林和梯度提升树混合集成的二噁英排放浓度预测方法。
技术介绍
经济的迅速发展和城市化建设的不断升级使得我国城市固体废物(MSW)的产生量迅速增加,特别是在经济发达和人口密集的地区,某些城市正面临着垃圾围城危机[1]。城市固体废物焚烧(MSWI)发电是实现垃圾减量化、资源化、无害化的典型处理方式[2]。目前国内MSWI发电厂数量已超过300座,炉排炉式焚烧炉占比超过了2/3[3]。由于我国垃圾组分的特殊性,导致引进的焚烧设备多处于人工手动控制运行状态,常出现“水土不服”的现象,同时造成了MSWI排放不合标等问题[4]。针对这种现象,最为紧要的问题是:如何在满足经济效益的情况下控制MSWI过程的污染排放[5]。二噁英(DXN)作为MSWI排放的一种具有极强化学性和热稳定性的剧毒持久性有机污染物,是造成焚烧建厂出现“邻避效应”的主要原因之一[6]。在实际工业过程中,主要通过在线采样与离线实验分析相结合的方法按照一定的周期进行DXN排放浓度检测[3],但该方式成本昂贵且周期比较长,主要问题是:难以支撑MSWI运行参数的实时优化控制以达到使DXN排放浓度最小化的目的[7]。因此,实现DXN排放浓度的在线预测非常必要。MSWI过程具有复杂的物理和化学特性,难以建立DXN排放浓度的精确机理模型[8]。DXN排放浓度的在线预测是实现MSWI过程优化控制必不可少的重要环节[9]。针对DXN的在线检测研究,目前多是先进行相关关联物的测量再通过映射关系实现DXN的在线预测[10,11,12];但存在设备昂贵、适应性弱和预测精度有待提升等问题[3]。软测量方法具有比直接离线分析和关联物检测更快、更经济地预测难测参数的能力,其在工业领域中已得到广泛应用[13]。针对MSWI过程,已存在采用特征选择结合神经网络构建DXN预测建模的研究[14,15,16];由于DXN建模数据具有的样本少、维数高、共线性等特性,使得这些方法存在易落入局部最小值、过拟合和模型泛化性能差等问题。针对传统单一预测模型存在的局限性,基于集成学习的预测模型成为当前研究热点。随机森林(RF)算法具有较强的噪声处理和非线性数据建模能力[17,18],但较少用于非线性回归[19]。文献[20]面向静电传感器阵列,采用基于RF的集成模型预测硫化床中生物质的水分含量。文献[21]提出基于主成分分析和RF的软测量模型,用于在线预测双螺杆挤出过程中聚丙交酯的拉伸性能。文献[22]提出了具有自我监测的RF模型在线估算磨机中的P80粒径。相对于基于建模数据采样进行并行集成的RF算法,梯度提升决策树(GBDT)是另外一种比较流行的机器学习算法[23],但在样本特征维数较高且样本数量较大时,其效率和可伸缩性仍有待提高[24]。文献[25]集逻辑回归(LR)、GBDT和投票特征间隔(VFI)等方法于一体对滑坡敏感性进行评估。文献[26]采用GBDT进行建筑能耗预测。文献[27]构建基于GBDT的自动判断电力系统负荷周期的预测模型。文献[28]提出了一种基于GBDT的光伏功率预测模型,主要思想是通过梯度提升对二叉树进行集成融合。文献[29]采用基于实例的迁移学习方法结合GBDT建立风力发电分位数回归模型。文献[30]结合GBDT提出了基于Bagging集成学习框架的预测模型。以上研究多采用单一的RF或GBDT算法建模,难以有效构建具有小样本、高维特性的DXN排放浓度预测模型。
技术实现思路
二噁英(DXN)是城市固废焚烧(MSWI)过程排放的剧毒污染物。目前实际工业过程主要通过先现场采集排放烟气样品再在实验室化验分析的方式对DXN排放浓度进行检测,存在周期长、费用高等问题。本申请利用过程控制系统实时采集的过程变量,建立基于随机森林(RF)和梯度提升树(GBDT)混合集成的DXN排放浓度预测模型。首先,针对具有小样本高维特性的DXN建模数据进行训练样本和输入特征的随机采样以生成训练子集;接着,基于训练子集建立J个基于RF的DXN子模型;然后,对每个基于RF的DXN子模型进行I次迭代,构建J×I个基于GBDT的DXN子模型;最后,对基于RF和GBDT的DXN子模型的预测输出采用简单平均加权方式进行合并,获得最终输出。采用集成RF和GBDT的DXN预测模型构建方法能够提高DXN在线预测精度,辅助进行MSWI过程操作参数的运行优化,提高企业经济效益。附图说明图1城市固废焚烧工艺流程;图2建模策略图;图3训练数据的预测曲线;图4测试数据的预测曲线。具体实施方式面向DXN生成的MSWI过程描述MSW通过车辆运输到地磅称重后卸入垃圾池,经3~7天的生物发酵和脱水后,由垃圾抓斗投放至加料斗,经进料器将其推送到焚烧炉排上,先后经历干燥、燃烧和燃烬三个主要阶段。干燥后的MSW中的可燃成分通过一次风机输送的助燃空气开始着火燃烧,产生的灰渣从炉排末端落至输渣机上后再进入到渣坑,最后在指定地点进行填埋处理。燃烧过程产生的高温烟气在一燃室的温度应控制在850℃以上,以保证有害气体的分解和燃烧。烟气经过二燃室时,通过二次风机输送的空气产生高度湍流并保证烟气停留超过2s,使有害气体进一步分解。高温烟气随后进入余热锅炉系统,通过吸热产生的高温蒸汽推动汽轮发电机组进行发电。随后烟气混合石灰和活性炭进入脱酸反应器发生中和反应,吸附其中的DXN和重金属,接着在袋式除尘器中被除去烟气颗粒物、中和反应物和活性炭吸附物,部分烟灰混合物在混合器中加水后重新进入脱酸反应器进行重复处理。反应器和袋式除尘器产生的飞灰进入到飞灰罐后需运输至相关机构以进一步处理。最终的尾气通过引风机经烟囱排放到大气,其包含烟尘、CO、NOx、SO2、HCL、HF、Hg、Cd和DXN等物质。由图1可知,MSWI过程主要是将MSW转化为残渣、飞灰、烟气与热量,其中残渣、飞灰与烟气三种产物与DXN的排放相关[31]。炉膛残渣产生量多,但DXN浓度含量较低;飞灰产生量比残渣少,其DXN浓度比残渣高;烟气中的DXN浓度包括不完全燃烧生成和新规合成反应生成两种方式[32]。目前,针对DXN检测主要是企业和环保部门以月或者季度为周期进行离线化验,不仅周期长而且费用昂贵。由此可知,DXN建模数据存在真值样本少、过程变量维数高等问题;同时,也存在MSW中的DXN含量未知、DXN生成和吸收阶段的机理复杂不清等客观问题。因此,采用软测量技术建立DXN排放浓度预测模型符合实际需求。本文提出RF和GBDT(EnRFGBDT)混合集成的DXN建模策略,包含训练样本与输入特征随机采样、基于RF的DXN子模型构建、基于GBDT的DXN子模型构建和基于简单平均的DXN集成预测共4个模块,如图2所示。在图2中,表示与采集DXN化验样品同时段的MSWI过程的炉膛温度、活性炭喷射量、烟囱排放气体浓度、炉排速度、一次风\二次风流量由过程控制系统所采集的过程变量(输入特征)所组成的输入数据,其中N为训练样本数量,M为过程变量数量;本文档来自技高网
...

【技术保护点】
1.一种二噁英排放浓度预测方法,其特征在于,包括以下步骤:/n步骤1、通过训练样本与输入特征随机采样模块,对训练样本集{X∈R

【技术特征摘要】
1.一种二噁英排放浓度预测方法,其特征在于,包括以下步骤:
步骤1、通过训练样本与输入特征随机采样模块,对训练样本集{X∈RN×M,y∈RN×1}进行有放回的N次随机采样并随机选择固定数量的输入特征,生成训练子集其中,表示与采集DXN化验样品同时段的MSWI过程的炉膛温度、活性炭喷射量、烟囱排放气体浓度、炉排速度、一次风\二次风流量由过程控制系统所采集的过程变量所组成的输入数据,其中N为训练样本数量,M为过程变量数量;表示在MSWI过程末端,即在烟囱排放处进行在线采集离线化验的DXN排放浓度组成的输出数据;
步骤2、通过基于RF的DXN子模型构建模块,利用生成的训练子集建立基于RF的DXN子模型将DXN排放浓度预测值与测量值进行相减,得到预测误差
步骤3、通过基于GBDT的DXN子模型构建模块,以输出的误差作为输出数据真值,和训练子集输入数据组成新的训练子集针对每个训练子集进行I次迭代后,构建I×J个基于GDBT的DXN子模型
步骤4、通过基于简单平均的DXN集成预测模块,将基于RF的DXN子模型和基于GBDT的DXN子模型进行简单平均,建立最终的DXN排放浓度预测模型。


2.如权利要求1所述的二噁英排放浓度预测方法,其特征在于,所述训练样本与输入特征随机采样模块的具体工作过程为:
采用自助采样法(Bootstrap)与随机子空间法(RSM)对MSWI过程数据进行处理,利用Bootstrap抽取与训练样本子集的样本数量相同的训练子集,随后引入RSM机制随机选择部分特征,最终生成包含N个样本和Mj个特征的J个训练子集,
训练子集的产生过程可表示为:



其中,{Xj,yj}表示第jth个训练子集;表示第jth个训练子集的第nth个输入和输出样本对;m=1,L,Mj,Mj表示第jth个训练子集所包含的输入特征数量,通常存在Mj<<M。


3.如权利要求2所述的二噁英排放浓度预测方法,其特征在于,所述基于RF的DXN子模型构建模块的具体工作过程为:
以第jth个训练子集为例描述构建过程,
首先去除因随机采样造成的训练子集中所存在的重复样本,并将其标记为以第mth个输入特征xj,m作为切分变量,以第nselth个样本所对应的值作为切分点,将输入特征空间切分为两个区域R1和R2,



基于以下准则遍历寻找最佳切分变量编号和切分点取值,



其中,和分别表示第jth个训练子集在R1和R2区域的DXN排放浓度的测量值;C1和C2分别表示在R1和R2两个区域的DXN排放浓度测量值的均值,
基于上述准则,首先通过遍历所有输入特征找到最优切分变量编号和切分点的取值,并将输入特征空间划分为两个区域;然后对每个区域重复上述过程,直到叶子点所包含的训练样本数量少于预先设定的阈值θRF;最终将输入特征空间划分为K个区域,将这些区域分别标记为R1,L,Rk,L,RK,所述K也表示CART回归树的叶子节点数,
采用CART回归树构建的基于RF的DXN子模型可表示为:



其中,



其中,表示区域Rk所...

【专利技术属性】
技术研发人员:汤健夏恒乔俊飞郭子豪
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1