【技术实现步骤摘要】
基于聚类分析和随机森林回归的核电机组电功率预测方法
本专利技术属于电力系统领域,涉及一种基于聚类分析和随机森林回归的核电机组电功率预测方法。
技术介绍
核能因其清洁、发电稳定的特性,在世界能源结构中占有重要地位。以法国、美国、德国为首的一批发达国家早已大力发展核电技术。面对日趋严重的资源、环境压力,我国能源形势日渐严峻,调整能源结构刻不容缓。2020年核电装机容量有望达到5800万千瓦,持续上升的装机规模促使人们关注核电机组运行中产生的问题。近年来,国内某核电站由于取、排水口的布置问题,机组夏季运行时全潮平均温升偏大于设计温升,海水温度的变化引起机组背压的变化,出现了夏季工况机组输出电功率偏低的现象,具体表现为涨落潮期间凝汽器海水入口温度快速变化。为了避免机组在海水温度上升最高期间反应堆热功率超过100%,需要在日常运行时限制机组出力。针对这个问题,对机组运行数据进行监测,利用机组运行的历史数据,建立机组运行参数对机组电功率影响关系,从而准确预测机组电功率变化,对汽轮机高压调节阀开度调整提供运行指导。在核电机组实际运行时,影响机组电功率的参数多种多样,并且这些参数间具有很强的相关性和共线性,从理论上很难分析各个参数单独作用于机组电功率的机理,而传统的多元线性回归模型又难以达到较高的拟合精度;随机森林回归模型相较于传统的回归模型,具有泛化能力强、训练速度快、实现简单、预测准确等优势,现已应用于风电领域预测,但未在核电机组得到应用,因此对于随机森林回归模型在核电站常规岛的应用研究具有重要意义。r>
技术实现思路
本专利技术采用的是基于聚类分析和随机森林回归的核电机组电功率预测方法。通过聚类分析对机组的历史运行数据进行特征提取,用以训练随机森林回归模型,从而可以根据机组实时运行数据预测机组电功率。由于通过聚类分析实现了数据降维,通过构建随机森林回归模型避免了构建机理模型,本专利技术具有预测精度高、预测速度快、泛化能力强的优点。本专利技术采用如下技术方案:基于聚类分析和随机森林回归的核电机组电功率预测方法,包括以下步骤:(1)获取机组历史运行数据。(2)对机组历史运行数据进行清洗,剔除异常数据。(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值。(4)采用标准化的方法对特征值和目标值(电功率)进行无量纲化处理,由此得到用于随机森林回归的数据集。标准化的公式可表达为:式中,X′为标准化后的样本值,X为原样本值,为原样本的均值,s为原样本的标准差。(5)对步骤(4)得到的数据集进行拆分,得到训练集和测试集。训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果。(6)建立随机森林回归模型,使用训练集对其进行训练。(7)使用测试集对随机森林回归模型进行测试,采用平均绝对误差(MAE)、均方误差(MSE)、R平方值三种评估指标,评估随机森林回归模型的预测效果。(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数(较小的最小叶子数使模型更容易捕捉训练集中的噪声,较大的决策树个数使模型拥有更好的性能,但同时也使模型的训练速度变慢)重复步骤(6)至(8),直至随机森林回归模型的R平方值大于0.999。(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。进一步的,步骤(1)中,所述机组历史运行数据为核电站常规岛的历史运行数据,包括主蒸汽参数、凝汽器运行参数、回热器再热器运行参数等。进一步的,步骤(2)中,所述异常数据为测点异常数据和操作过程数据,后者如机组启停机时产生的数据等。进一步的,步骤(5)中,数据集进行拆分前,应打乱其顺序使其随机排序,再进行拆分。进一步的,步骤(7)中,R平方值又称为决定系数,反映因变量的全部变异能通过回归关系被自变量解释的比例。本专利技术由于采用以上技术方案,使之与现有技术相比,具有以下的优点:在机组实际运行时,影响机组电功率的因素多种多样,并且这些参数间具有很强的相关性和共线性,从理论上很难分析各个参数单独作用于机组电功率的机理,本专利技术引入统计学习的方法,采用聚类分析对机组的历史运行数据进行特征提取,实现了数据降维,再通过随机森林回归对特征值和目标值进行训练,避免了构建机理模型。采用随机森林回归模型进行机组电功率预测,大大提高了预测精度,缩短了预测所用的时间。随机森林回归模型的泛化能力强,可以适应不同的核电机组。附图说明图1是本专利技术基于聚类分析和随机森林回归的核电机组电功率预测方法流程图。图2是本专利技术实施例中聚类分析结果局部图。图3是本专利技术实施例中随机森林回归模型预测值与机组运行实际值对比局部图。具体实施方式下面结合附图,通过一个某1000MW核电站机组电功率预测的实施例,对本专利技术做进一步说明。如图1所示,本专利技术提供了一种基于聚类分析和随机森林回归的核电机组电功率预测方法,具体包括以下步骤:(1)获取机组历史运行数据。在本实施例中,获取某1000MW核电站常规岛2016年1月至2019年8月的历史运行数据,共200个运行数据测点,采样间隔10min。(2)对机组历史运行数据进行清洗,剔除异常数据。在本实施例中,剔除异常数据后,共有174410个样本。(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值。图2是本专利技术实施例中聚类分析结果局部图。由图可知,凝汽器循环水入、出口温度为一类,分别取凝汽器循环水入口温度和出口温度的测点的平均值作为特征值。基于同样的理由,取凝汽器入口压力的测点的平均值作为特征值。结合理论和电厂运行的实际经验,最终选取本实施例的特征值如表1所示。表1.特征值列表(同一特征存在多个测点则取其均值)(4)采用标准化的方法对特征值和目标值(电功率)进行无量纲化处理,由此得到用于随机森林回归的数据集。标准化的公式可表达为:式中,X′为标准化后的样本值,X为原样本值,为原样本的均值,s为原样本的标准差。(5)对上一步骤得到的数据集进行随机拆分,得到训练集和测试集。训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果。在本实施例中,取测试集样本数为数据集总样本数的30%。(6)建立随机森林回归模型,使用训练集对其进行训练。在本实施例中,选取最小叶子数为1,决策树个数为100。(7)使用测试集对随机森林回归模型进行测试,评估随机森林回归模型的预测效果。在本实施例中,该随机森林回归模型的平均绝对误差(MAE)为0.01066、均方误差(MSE)为0.00043、R平方值为0.99957。(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数。在本实施例中,由于随机森林回归模型的R平方值已大于0.999,故不再对随机森林回归模型的参数进行调整。(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。图3是本本文档来自技高网...
【技术保护点】
1.基于聚类分析和随机森林回归的核电机组电功率预测方法,包括以下步骤:/n(1)获取机组历史运行数据;/n(2)对机组历史运行数据进行清洗,剔除异常数据;/n(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值;/n(4)采用标准化的方法对特征值和目标值进行无量纲化处理,由此得到用于随机森林回归的数据集;/n标准化的公式表达为:
【技术特征摘要】
1.基于聚类分析和随机森林回归的核电机组电功率预测方法,包括以下步骤:
(1)获取机组历史运行数据;
(2)对机组历史运行数据进行清洗,剔除异常数据;
(3)采用聚类分析对清洗后的历史运行数据进行特征提取,得到特征值;
(4)采用标准化的方法对特征值和目标值进行无量纲化处理,由此得到用于随机森林回归的数据集;
标准化的公式表达为:
式中,X′为标准化后的样本值,X为原样本值,为原样本的均值,s为原样本的标准差;
(5)对步骤(4)得到的数据集进行拆分,得到训练集和测试集;训练集用于训练随机森林回归模型,测试集用于评估随机森林回归模型的预测效果;
(6)建立随机森林回归模型,使用训练集对其进行训练;
(7)使用测试集对随机森林回归模型进行测试,采用平均绝对误差(MAE)、均方误差(MSE)、R平方值三种评估指标,评估随机森林回归模型的预测效果;
(8)优化随机森林回归模型,调整随机森林的最小叶子数和决策树个数;重复步骤(6)至(8),直至随机森林回归模型的R平方值大于0.999;
(9)使用随机森林回归模型根据机组实时运行数据进行机组电功率预测。
2.根据...
【专利技术属性】
技术研发人员:李蔚,吴恺逾,盛德仁,陈坚红,鲍旭东,胡跃华,蔡超,骆雪莲,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。