一种基于大数据挖掘的超超临界机组能耗分析方法技术

技术编号:39671044 阅读:9 留言:0更新日期:2023-12-11 18:36
一种基于大数据挖掘的超超临界机组能耗分析方法,对超超临界机组数据进行时延校正并采用随机森林算法进行特征提取,对得到的数据再进行聚类划分,得到各个工况

【技术实现步骤摘要】
一种基于大数据挖掘的超超临界机组能耗分析方法


[0001]本专利技术属于能耗分析研究领域,具体涉及一种基于大数据挖掘的超超临界机组能耗分析方法


技术介绍

[0002]基于我国的资源分布情况,以煤炭作为一次能源的火力发电方式仍然在我国占据十分重要的地位

近年来,超临界火电机组凭借其高能效的优点逐渐在发达国家中被广泛使用,在我国的装机比例也越来越大,因此,着手研究超临界火电机组的能耗特性分析是十分重要的

[0003]随着大数据

人工智能等技术的快速发展,火电厂在信息化水平不断提升的同时,智能设备储存了海量的实时监测数据和历史数据

然而,传统的数据分析方法在处理如此庞大的数据库时存在一定局限性

为了克服这一挑战,大数据挖掘技术应运而生,并与火电厂机组优化运行相结合,为节能减排提供了新的解决方案

通过应用决策树算法

聚类分析法等大数据挖掘技术,火电厂能够从历史数据中提取出有价值的信息

这一领域正成为当前电力生产的研究热点和发展方向

因此,推广大数据挖掘技术到火电厂,以发掘历史数据中的有效信息,具有重要意义,并为进一步提升电力行业的效率和可持续发展提供了新的机遇

[0004]调节特征优先级在火电能耗影响评估中具有重要性

火电厂作为重要的能源供应单位,其能耗水平直接影响到电力行业的可持续发展和资源利用效率

通过分析和理解不同特征对火电能耗的影响,可以为火电厂提供有效的节能措施和优化建议

通过对各个特征进行排序和调整,能够确定哪些特征对能耗的影响更为显著,从而更有针对性地制定节能策略

调节特征优先级还可以识别出优化潜力更大的特征

通过重新排序和调整特征的优先级,可以发现一些可能被忽视的关键特征,这种重新评估可以为火电厂提供新的优化方向和改进点,从而更好地控制和降低能耗

此外,调节特征优先级也可以建立更准确的预测模型

根据特征的重要性对其进行加权,可以构建更精确的能耗预测模型

这样的模型可以提供更可靠的能耗预测结果,帮助火电厂做出更准确的决策,进一步优化能源消耗和降低成本


技术实现思路

[0005]为了克服现有技术的不足,为了提高超超临界机组的经济性,本专利技术提出了一种基于大数据挖掘的超超临界机组能耗分析方法,运用到的大数据挖掘技术包括随机森林算法
、K

means
聚类算法;对超超临界机组的历史数据进行时延校正

归一化,将清洗过的数据输入随机森林算法得到与能耗相关性较大的几组特征

基于所得出的特征,采用聚类算法进行工况划分

对划分后的工况分别建立支持向量机模型,并采用智能算法对支持向量机模型中的参数进行寻优;取各工况最优参数模型作为全局敏感度分析的输入,得到参数的调控顺序;使得机组快速达到指定功率,节省成本,提高经济性

[0006]为了解决上述技术问题本专利技术提供如下技术方案:
[0007]一种基于大数据挖掘的超超临界机组能耗分析方法,包括以下步骤:
[0008]S1
:针对火电机组高滞后

非耦合的特性,对超超临界机组数据进行时延校正,特征筛选及归一化处理;
[0009]S2
:基于筛选出的数据,采用
K

means
聚类算法将其划分为多个子工况;
[0010]S3
:针对不同工况建立回归模型,并用智能算法进行参数寻优,取最优模型进行敏感度分析

[0011]所述步骤
S1
中,超超临界机组历史数据预处理包括以下子步骤:
[0012]S1

1.
对超超临界机组数据进行时延校正:
[0013]取目标
Y
的任意
H
长度的连续时序序列:
[0014]Y
K

H+K
‑1=
[Y
K

Y
K+1

Y
K+2

...

Y
H+K
‑1]ꢀꢀꢀꢀ
(1)
[0015]式中,
Y
K

H+K
‑1表示目标
Y

K
开始的长度为
H
的连续时序序列,
Y
K
表示目标
Y
的第
K
个值;
[0016]取特征
X

(2a+1)

H
长度的连续时序序列:
[0017][0018]式中,
X
K

a

H+K

a
‑1表示特征
X

K

a
开始的长度为
H
的连续时序序列,
X
K

a
表示特征
X
的第
K

a
个值;
[0019]将这
(2a+1)
个序列分别与
Y
K

H+K
‑1计算
(2a+1)

CORT
一阶时序相关性系数,得到一个长度为
(2a+1)
的特征
X
与预测目标
Y

CORT
X

Y
序列;
[0020]CORT
X

Y
序列的最大值点对应特征
X
与预测目标
Y
之间的时延差,即为特征
X
与预测目标
Y
之间的时延大小;
[0021]S1

2.
采用随机森林算法筛选与能耗相关的特征;
[0022]S1

3.
对筛选出来的数据进行归一化处理:
[0023][0024]式中,
X
i

f
表示特征
f
中第
i
个参数,
X
i

f

表示归一化后特征
f
中第
i
个参数,
X
f

min
表示特征...

【技术保护点】

【技术特征摘要】
1.
一种基于大数据挖掘的超超临界机组能耗分析方法,其特征在于,所述方法包括以下步骤:
S1
:针对火电机组高滞后

非耦合的特性,对超超临界机组数据进行时延校正,特征筛选及归一化处理;
S2
:基于筛选出的数据,采用
K

means
聚类算法将其划分为多个子工况;
S3
:针对不同工况建立回归模型,并用智能算法进行参数寻优,取最优模型进行敏感度分析
。2.
如权利要求1所述的一种基于大数据挖掘的超超临界机组能耗分析方法,其特征在于,所述步骤
S1
中,对超超临界机组数据预处理包括以下子步骤:
S1

1.
对超超临界机组数据进行时延校正:取目标
Y
的任意
H
长度的连续时序序列:
Y
K

H+K
‑1=
[Y
K

Y
K+1

Y
K+2

...

Y
H+K
‑1]
ꢀꢀꢀꢀ
(1)
式中,
Y
K

H+K
‑1表示目标
Y

K
开始的长度为
H
的连续时序序列,
Y
K
表示目标
Y
的第
K
个值;取特征
X

(2a+1)

H
长度的连续时序序列:式中,
X
K

a

H+K

a
‑1表示特征
X

K

a
开始的长度为
H
的连续时序序列,
X
K

a
表示特征
X
的第
K

a
个值;将这
(2a+1)
个序列分别与
Y
K

H+K
‑1计算
(2a+1)

CORT
一阶时序相关性系数,得到一个长度为
(2a+1)
的特征
X
与预测目标
Y

CORT
X

Y
序列;
CORT
X

Y
序列的最大值点对应特征
X
与预测目标
Y
之间的时延差,即为特征
X
与预测目标
Y
之间的时延大小;
S1

2.
采用随机森林算法筛选与能耗相关的特征;
S1

3.
对筛选出来的数据进行归一化处理:式中,
X
i

f
表示特征
f
中第
i
个参数,
X
i

f

表示归一化后特征
f
中第
i
个参数,
X
f

min
表示特征
f
的最小值,
X
f

max
表示特征
f
的最大值
。3.
如权利要求1或2所述的一种基于大数据挖掘的超超临界机组能耗分析方法,其特征在于,所述步骤
S2
中,工况划分包括以下子步骤:
S2

1.
输入预处理完的数据,初始化
k
个点以作为簇的中心;
S2

2.
将数据集中的数据点根据欧氏距离分配给各簇,两点之间的欧氏距离为:式中,
X
为数据对象,
C
i
为第
i
个聚类中心,
n
为数据对象的维度,
X

【专利技术属性】
技术研发人员:魏春蔡程翔张兴凡章成
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1