基于特征构建和特征选择的火电机组煤耗智能预测方法技术

技术编号:38592011 阅读:7 留言:0更新日期:2023-08-26 23:30
本申请公开了基于特征构建和特征选择的火电机组煤耗智能预测方法,所述步骤如下:通过传感器收集火电机组历史监控数据,使用K

【技术实现步骤摘要】
基于特征构建和特征选择的火电机组煤耗智能预测方法


[0001]本申请涉及数据挖掘领域,尤其是基于特征构建和特征选择的火电机组煤耗智能预测方法。

技术介绍

[0002]以水电、风电和太阳能发电等为代表的清洁能源具有显著的间歇性和不确定性的特点,其发电量易受气候、季节和时段等因素的影响。
[0003]为了尽量充分利用清洁能源,提高清洁能源占比,规避大规模“弃风、弃水和弃光”现象的发生,需要在电力市场辅助服务机制的帮助下,以火电作为辅助和备用能源来提升电网整体的稳定性;当清洁能源供给量充足时降低火力发电量,当清洁能源供给量不足时增加火力发电量,火电由现在的基础电力来源角色转变为清洁能源发电的动态补充电力。也就是在电力系统中,火电需要在电网调峰为可再生能源的接入提供了必要的基础和保障。
[0004]这意味着火电的角色将从过去的稳定运行以提供电力负载中的基荷转变为快速调节以应对电力负载中的峰荷,这种火力发电运营模的重大改变给火电机组运营优化与机组调度带来了新的挑战。如何在电网调峰条件下实现高效运行、节能减排是火电企业必须解决的一个管理问题。建立准确有效的火电机组煤耗预测模型是实现上述目标需要解决的最根本问题之一。
[0005]近年来,包括分布式控制系统、监控信息系统、工厂信息系统和现场总线控制系统在内的智能管理部署越来越受到火电企业的关注。这些系统使火电企业能够记录火电机组的实时运行状态和发电数据。基于运行数据的数据驱动技术经常被用于火力发电厂各个领域的建模和分析,如燃煤发电机组的故障诊断、燃煤发电机组基准区间的确定,以及为操作员优化汽轮机系统自变量参考值。与传统的基于机构的建模相比,数据驱动方法具有更大的通用性和准确性。
[0006]然而,很少有研究关注火电机组的煤耗预测。经检索,文献中最接近的研究是提出了一项关于最小二乘支持向量机理论在预测煤耗方面的研究(Zhang L.,Zhou L.,&Zhang Y.et al.Coal consumption prediction based on least squares support vector machine[C].IOP Conference Series:Earth and Environmental Science,2019,227(3),032007)。而在煤耗预测模型的指标选择方面,他们直接基于领域知识制定了20个特征,这种基于经验的特征分配错过了找到更好的特征子集来建立煤耗预测模式的可能性。
[0007]从火电厂的原始运行数据中获取最优关键特征集的问题通常具有高维、复杂非线性和强耦合性,大量特征导致模型构建过程中出现错误,并显著增加预测模型的计算成本。因此,识别关键特征以用作预测模型的输入变量是至关重要的。发现特征之间缺失的关系并构建可能更好的特征是一个被称为特征构建的过程,这也可能导致创建许多不必要的特征。一种经常用来解决这个问题的方法是特征选择,它包括选择重要特征和消除不重要的特征。通过降低时间复杂性、提高准确性和降低过拟合风险,特征选择可以增强机器学习预
测模型。
[0008]综上所述,现有研究方法并不能充分利用火电机组数据并准确预测火电机组的煤耗水平,因此针对上述问题提出一种基于特征构建和特征选择的火电机组煤耗智能预测方法。

技术实现思路

[0009]在本实施例中提供了基于特征构建和特征选择的火电机组煤耗智能预测方法,经过计算得到火电机组的预测煤耗,其具有客观公正、准确易行的特点。
[0010]根据本申请的一个方面,提供了基于特征构建和特征选择的火电机组煤耗智能预测方法,所述智能预测方法包括如下步骤:
[0011]步骤一、对于通过安装在火电机组上的传感器所收集到的历史监控数据X=(X1,...,X
d
),使用K

means算法进行聚类分析以划分不同的火电机组基本工况,其中X
j
=(x
1,j
,

,x
n,j
)
T
是表示X中第j个特征的列向量,x
i,j
是第j个特征的第i个样本,Y=(y1,...,y
n
)
T
是与监控数据X对应的火电机组煤耗,其中y
i
表示第i个样本的煤耗值,i=1,2,...,n,j=1,2,...,d,n是样本总数,d是特征总数;
[0012]首先,将聚类数量设置为k,然后随机选择k个观测值作为初始聚类中心;其次,在测量每个观测点与每个聚类中心之间的距离后,指定最接近每个观测点的聚类;然后,重新计算现在每个类别的聚类中心并更新聚类中心结果;重复该过程,直到迭代次数达到预定阈值m;
[0013]对于不同的聚类数量k的取值,使用轮廓系数来评估最理想的聚类数量;计算所有不同的聚类数量k所对应的轮廓系数,选取其中轮廓系数最大的所对应的聚类数目作为最终的聚类数;
[0014]步骤二、火电机组系统中各种特征的记录数据来自放置在各种系统位置的各种传感器;然而,这些特征的测量值可能不会立即获得,这意味着在不同的参数内以及在特征和相应的煤耗之间可能存在相应的延迟或提前时间;因此,为了创建一个准确的火电机组煤耗智能预测模型,我们使用特征构建来反映这种延迟或提前时间现象;
[0015]每个特征的记录数据都是一个时间序列,我们每次考虑一个时间间隔来刻画每个特征一个时间点的延迟或提前效应;我们分别考虑总共l的延迟或提前时间间隔,因为每个特征可以构建出额外的2l个特征,则特征的数量从d个增加到2ld+d个;
[0016]步骤三、高维特征集会对回归机器学习模型产生许多不利影响,例如增加模型的时间复杂性、降低其精度以及增加过拟合风险等,我们使用遗传算法来剔除那些无意义的冗余特征以实现特征子集的提炼和精简;
[0017]首先进行编码,原始特征集的每个可能的子集可以表示为染色体,并且染色体中的每个基因指示相应的特征;当基因的值被赋为1时,代表这个特征子集中选择相应的特征,而当基因的值被赋为0时,则代表这个特征子集中不选择相应的特征;
[0018]然后根据编码规则,随机生成给定数量的染色体,形成初始群体;每个染色体都使用其均方根误差作为适应度函数进行评估;基于遗传算法的选择、交叉和变异操作,生成新的一代染色体种群;
[0019]重复上一步操作,直到达到指定的迭代次数M,输出最后一代种群中的最优染色
体,该染色体所对应的特征子集即为特征选择的结果;
[0020]步骤四、通过Matlab 2021b软件中的装袋树模型,使用步骤三中所筛选出的特征子集作为自变量,将煤耗作为因变量,使用5交叉验证方法,建立装袋树回归预测模型;
[0021]则对于后续任意的新到达的火电机组监控数据样本,将该样本带入前述建立的回归预测模型,即可得到该样本对应的火电机组煤耗预测。
[0022]本申请的有益之处在于:
[0023]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于特征构建和特征选择的火电机组煤耗智能预测方法,其特征在于:所述智能预测方法包括如下步骤:步骤一、通过安装在火电机组上的传感器收集火电机组历史监控数据,使用K

means算法对上述数据进行聚类分析以划分不同的火电机组基本工况;步骤二、在火电机组系统中各种特征的记录数据在特征之间和相应的煤耗之间可能存在延迟或提前的情况下,使用特征构建来反映这种延迟或提前时间现象,以期得到更多的潜在优质子集;步骤三、使用遗传算法剔除无意义的冗余特征以实现特征子集的提炼和精简,用于应对高维特征集会对回归机器学习模型产生许多不利影响;步骤四、使用步骤三中所筛选出的特征子集作为自变量煤耗作为因变量建立装袋树回归预测模型,对于后续的实时监测数据通过该回归预测模型实时预测火电机组的煤耗。2.根据权利要求1所述的基于特征构建和特征选择的火电机组煤耗智能预测方法,其特征在于:所述步骤一中的K

means聚类分析如下:对于通过安装在火电机组上的传感器所收集的历史监控数据X=(X1,...,X
d
),使用K

means算法对上述数据进行聚类以划分不同的火电机组基本工况,其中X
j
=(x
1,j
,

,x
n,j
)
T
是表示X中第j个特征的列向量,x
i,j
是第j个特征的第i个样本,Y=(y1,...,y
n
)
T
是与之对应的煤耗,其中y
i
表示第i个样本的煤耗值,i=1,2,...,n,j=1,2,...,d,n是样本总数,d是特征总数;将指定的聚类数量设置为k,然后随机选择k个观测值作为初始聚类中心;然后在测量每个观测点与每个聚类中心之间的距离后,指定最接近每个观测点的聚类;然后重新计算现在每个类别的聚类中心并更新聚类中心结果;重复该过程,直到迭代次数达到预定阈值m;对于不同的聚类数量k的取值,使用轮廓系数来评估最理想的聚类数量;计算所有不同的聚类数量k所对应的轮廓系数。3.根据权利要求2...

【专利技术属性】
技术研发人员:朱磊章魏周健张丽忠刘永平
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1