一种基于集成混合模型的电厂再热烟气挡板操作预测方法技术

技术编号:36128082 阅读:53 留言:0更新日期:2022-12-28 14:36
本发明专利技术公开了一种基于集成混合模型的电厂再热烟气挡板操作预测方法,包括:(1)采集历史数据、(2)数据预处理及数据离散化、(3)指标关联分析、(4)数据归一化处理,构建模型数据集、(5)搭建CNN网络结构,CNN网络数据特征提取及Flatten化处理、(6)新特征数据集输入XGBoost、随机森林模型,模型训练、(7)模型结果分析、模型评估,判断模型准确性,模型分类预测。本发明专利技术能够有效提取再热烟气挡板调节数据特征,准确预测烟气挡板调节量,对电厂运行人员具有指导性作用,有助于提高机组整体性能和人员管理水平。人员管理水平。人员管理水平。

【技术实现步骤摘要】
一种基于集成混合模型的电厂再热烟气挡板操作预测方法


[0001]本专利技术涉及电厂再热烟气挡板控制
,具体涉及一种基于集成混合模型的电厂再热烟气挡板操作预测方法。

技术介绍

[0002]火力发电厂超超临界机组运行方式动态特性复杂、参数多变,精确并稳定地控制再热蒸汽温度对最大限度地提高蒸汽循环效率非常重要。常用的方法为通过对调节烟气挡板的结构来控制超超临界再热蒸汽温度。然而当前采用传统的烟气挡板自动调节方法难以对超超临界机组主汽温进行有效精准的控制,且在实际生产中,电厂操作人员在工作开展过程中可能呈现出误操作现象,或调温的灵敏度较差,调温幅度较小,继而影响系统运作效率。因此,准确预测烟气挡板操作量对操作人员具有指导性作用,可保证机组当前运行条件下稳定运行,有助于提高机组整体性能和人员管理水平。
[0003]现有技术中,再热蒸汽温度烟气挡板调节法是通过调节烟气挡板开度来改变流过过热器受热面和再热器受热面的烟气分配比例,从而达到调节再热汽温目的。烟气挡板操作量预测通常可通过机理模型和数理模型计算而来,机理模型是:当再热蒸汽温度较低,再热挡板开度增大,过热挡板开度减小。当再热蒸汽温度较高,再热挡板开度减小,过热挡板开度增大,调节量则通过专家经验或机理公式求得。而数理模型大多采用的是分类模型实现,数理模型大多基于历史数据利用XGBoost、CNN、SVM、RF等分类方法进行建模分析,根据当前运行数据给出烟气挡板调节量预测值,运行人员根据预测值和机理经验值进行操作,保证再热蒸汽温度稳定在设定值最优区间内。
[0004]目前,各电厂对再热烟气挡板调节手段有很多,有些电厂从系统跟踪、整合前馈信号等角度入手,采用自动调节系统进行挡板量控制,也有电厂通过手动调节手段使系统运作状态达到最佳。然而,在实际生产中,无论是自动调节还是手动调节,烟气挡板操作量都很难达到理想值。一方面由于专家经验和机理模型是根据历史数据统计得出的再热烟气挡板调节值,导致给出的调节值往往不准确。另一方面,数理模型目前大多采用回归预测模型对烟气挡板调节值进行数据预测,但是由于烟气挡板值实际生产中本身调节量在一个区间段内即可,若直接预测调节量数值结果不准确,达到的效果较差。另外,在其他领域数据预测场景时,有的学者将模型转换成分类模型进行求解。分类模型大多采用单一模型或组合模型进行建模。但从实际问题出发,再热系统是一个相对复杂的非线性系统,单一地使用传统分类模型可能并不足以提取数据中相应的非线性特征,且每种算法有不同的适用范围。比如,支持向量机能够简化分类问题,但是在大规模样本上难以实施;决策树比较适合处理有缺失属性的样本,但很容易出现过拟合;KNN在分类问题中精确度高且对数据没有什么假设条件,但是计算量大,样本出现不平衡问题时不能很好地解决。另外,传统机器学习单一模型有时提取的数据特征不能够完整表达,且模型训练容易陷入局部特征学习陷阱,很难学习到数据全面特征。

技术实现思路

[0005]为解决上述问题,本专利技术提供一种基于集成混合模型的电厂再热烟气挡板操作预测方法,该方法预测准确率高,对实现设备指标分类判别具有重要意义。
[0006]本专利技术技术方案如下:
[0007]本专利技术提供了一种基于集成混合模型的电厂再热烟气挡板操作预测方法,包括以下步骤:
[0008]步骤1、采集历史数据:根据业务应用场景选取电厂再热烟气挡板控制主指标及其相关指标,并从数据库中抽取设备相关运行历史数据;
[0009]步骤2、数据预处理及数据离散化:对历史数据进行异常值检测、缺失值填充,将烟气挡板相关数值型指标转换成离散型指标;
[0010]步骤3、指标关联分析:调节烟气挡板主要是对再热蒸汽温度进行调节,因此找出与再热蒸汽温度相关指标就是找出与烟气挡板相关的指标;根据筛选的相关指标基于数据采用皮尔逊相关性分析和互信息分析进行指标关联分析,筛选出关联度大的指标;
[0011]步骤4、数据归一化处理,构建模型数据集:对已筛选好的指标历史数据进行(0,1)归一化处理,构建模型数据集,归一化公式为:其中X
*
为数据归一化后的值,x为数据归一化前的值,min为样本数据中的最小值,max为样本数据中的最大值;
[0012]步骤5、搭建CNN网络结构,CNN网络数据特征提取及Flatten化处理:根据模型数据集特征设计CNN网络结构,将构建的模型数据集进行卷积操作,完成特征提取工作,提取特征后,将卷积操作获取的特征进行Flatten操作后与原始特征向量进行连接组成新的特征数据集;
[0013]步骤6、新特征数据集输入XGBoost、随机森林模型(RF模型),模型训练:将新特征数据集分别输入到XGBoost和RF模型中,通过网格搜索优化两模型参数,进行模型训练;
[0014]步骤7、模型结果分析、模型评估,判断模型准确性,模型分类预测:经过XGBoost和RF模型训练后,对模型分类预测验证,并将两个模型计算的各类别概率值进行加权平均,对两模型结果进行模型评估,最后选取准确率高的模型进行分类预测,本专利技术能够准确预测烟气挡板调节量。
[0015]根据本专利技术所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,步骤2中,采用3σ法则或隔离森林算法对历史数据进行异常值检测;所述3σ法则是根据样本数据对各指标进行计算处理得到平均值μ、标准偏差σ,剔除落在(μ

3σ,μ+3σ)之外的数据;所述隔离森林算法是采用多重二分法对样本数据进行分区,通过样本的疏密程度来判断样本是否孤立;检测出的异常点用空值填充,然后再根据空值比例判断是否删除该测点或填充。
[0016]进一步的,根据本专利技术所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,步骤2中,采用K临近算法(KNN)或回归拟合算法对历史数据进行缺失值填充;所述K临近算法是通过找出样本中缺失值前后k个最近的值,将这些值的平均值赋给该样本,即得到该样本对应属性的值,并用该值填充;所述回归拟合算法是指根据业务规则找出和缺失值关联较大的样本,通过该关联样本的值利用拟合公式来拟合缺失值样本的值,并用该值进行填充。
[0017]根据本专利技术所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,步骤3
中,所述皮尔逊相关性分析通过皮尔逊相关系数反应相关性,其中皮尔逊相关系数是指两个样本变量之间的协方差和标准差的商,相关系数计算公式如下:其中,X、Y为两个样本变量,当相关系数为0时,X、Y两个样本变量不相关;当X的值增大(减小),Y值减小(增大),X、Y两个样本变量负相关,相关系数在

1.0到0.0之间;当X的值增大(减小),Y值增大(减小),X、Y两个样本变量正相关,相关系数在0.0到+1.0之间。
[0018]进一步的,根据本专利技术所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,步骤3中,所述互信息分析方法为:设两个随机变量(X,Y)的联合分布为p(x,y),边缘分布分别为p(x)p(y),互信息I(X;Y)是联合分布p本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成混合模型的电厂再热烟气挡板操作预测方法,其特征在于,包括以下步骤:步骤1、采集历史数据:选取电厂再热烟气挡板控制主指标及其相关指标,从数据库中抽取设备相关运行历史数据;步骤2、数据预处理及数据离散化:对历史数据进行异常值检测、缺失值填充,将烟气挡板数值型指标转换成离散型指标;步骤3、指标关联分析:根据筛选的相关指标基于数据采用皮尔逊相关性分析和互信息分析进行指标关联分析,筛选出关联度大的指标;步骤4、数据归一化处理,构建模型数据集:对已筛选好的指标历史数据进行(0,1)归一化处理,构建模型数据集,归一化公式为:其中X
*
为数据归一化后的值,x为数据归一化前的值,min为样本数据中的最小值,max为样本数据中的最大值;步骤5、搭建CNN网络结构,CNN网络数据特征提取及Flatten化处理:根据模型数据集特征设计CNN网络结构,将构建的模型数据集进行卷积操作,完成特征提取工作,提取特征后,将卷积操作获取的特征进行Flatten操作后与原始特征向量进行连接组成新的特征数据集;步骤6、新特征数据集输入XGBoost、随机森林模型,模型训练:将新特征数据集分别输入到XGBoost和随机森林模型中,通过网格搜索优化两模型参数,进行模型训练;步骤7、模型结果分析、模型评估,判断模型准确性,模型分类预测:经过XGBoost和随机森林模型训练后,对模型分类预测验证,并将两个模型计算的各类别概率值进行加权平均,对两模型结果进行模型评估,最后选取准确率高的模型进行分类预测。2.根据权利要求1所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,其特征在于,步骤2中,采用3σ法则或隔离森林算法对历史数据进行异常值检测;所述3σ法则是根据样本数据对各指标进行计算处理得到平均值μ、标准偏差σ,剔除落在(μ

3σ,μ+3σ)之外的数据;所述隔离森林算法是采用多重二分法对样本数据进行分区,通过样本的疏密程度来判断样本是否孤立。3.根据权利要求1或2所述的基于集成混合模型的电厂再热烟气挡板操作预测方法,其特征在于,步骤2中,采用K临近算法或回归拟合算法对历史数据进行缺失值填充;所述K临近算法是通过找出样本中缺失值前后k个最近的值,将这些值的平均值赋给该样本,即得到该样本对应属性的值,并用该值填充;所述回归拟合算法是指根据业务规则找出和缺失值关联较大的样本,通过该关联样本的值利用拟合公式来拟合缺失值样本的值,并用该值...

【专利技术属性】
技术研发人员:张超唐守伟唐金鹤王新刘海瑞
申请(专利权)人:济南奔腾时代电力科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1