一种电力时序数据异常检测方法技术

技术编号:39735710 阅读:15 留言:0更新日期:2023-12-17 23:37
本发明专利技术公开了一种电力时序数据异常检测方法,属于数据异常检测技术领域

【技术实现步骤摘要】
一种电力时序数据异常检测方法


[0001]本专利技术涉及数据异常检测
,特别涉及一种电力时序数据异常检测方法


技术介绍

[0002]在工业生产过程中,随着电厂大数据平台的引入带来的电厂智能化的升级,会产生大量主要用于监控机器设备运行状态的时间序列数据

而随着各类传感器种类的丰富和传感器精度的提高,在电厂实际运行过程中各类传感器产生的时序数据通常存在多变量时间序列异常问题,如传感器损坏

网络抖动

设备机组运行异常等

为了感知这些数据中的异常,同时理解时间背景和变量之间的相互关系,时间序列的异常检测问题,特别是未标记数据的异常检测问题被广泛关注研究

[0003]目前,国内外学者针对时序异常数据检测,主要分为基于统计的方法和基于深度学习的方法

传统的方法通常假设数据服从特定的分布,但实际的电力时序数据往往具有复杂的非线性结构和时序依赖性

因此,基于传统的统计方法无法准确地捕捉到电力时序数据中的异常,异常检测模型在处理电力时序数据时存在一些局限性

[0004]随着深度学习技术的发展,越来越多基于深度学习的方法被应用到时序数据异常检测工作中来

例如
Hundman
等采用
RNN
循环神经系统,来处理多变量时序数据
。Vaswani
等试图采用图表或
Transformerr/>架构来关注变量和数据点之间的关系,这些方法考虑了数据的时间特性,成功地将深度神经网络应用于时间序列分析领域

但是大多数数据集都不为该区域的训练集提供真实数据标签

换句话说,一个点在训练集中是否异常是未知的
。Goodfellow
等在已有模型的基础上插入了自动编码器或对抗网络,以有效地理解数据分布

国内沙朝锋等也设计了基于长短期记忆网络的电力时间序列数据的异常检测方法

然而,在没有监督的情况下,从时间背景中检测异常仍然是一个困难的问题

[0005]综上,针对火电机组工况的识别,以及在不同工况下,依据多传感器间数据关联进行无监督的数据异常检测仍然是一个困难的问题


技术实现思路

[0006]1.
专利技术要解决的技术问题
[0007]为了解决上述问题,本专利技术提供了一种电力时序数据异常检测方法,本专利技术将结合随机森林和
ConvLSTM
网络的电力时序数据异常检测模型,运用到自监督模型训练中来解决时间序列数据异常问题,实现了在火电机组稳态和动态两种机组运行工况下,无监督的多传感器时序数据异常检测

本专利技术在检测多变量异常的时间序列时表现出极好的准确性

[0008]2.
技术方案
[0009]为达到上述目的,本专利技术提供的技术方案为:
[0010]本专利技术的一种电力时序数据异常检测方法,其步骤为:
[0011]步骤一

通过火电机组设置的多种传感器,采集火电机组运行过程中的多维时序
数据;
[0012]步骤二

建立融合随机森林和注意力机制的
ConvLSTM
网络结构模型,并对模型进行训练;
[0013]步骤三

通过训练的模型实现对步骤一采集的多维时序数据的检测和上送,判断该数据是否为异常数据,并做出标记,并用于后续的生产决策

[0014]更进一步地,步骤二所述的模型包括随机森林模型和
ConvLSTM
模型,随机森林模型确定火电机组当前所处的机组工况为稳态还是动态;并将划分好工况的时序数据送入
ConvLSTM
模型进行分别处理,处理结果再通过最小损失函数计算结果与阈值之间的关系,确定该数据是否为异常数据,并做出标记

[0015]更进一步地,所述
ConvLSTM
模型包括
ConvLSTM

s
网络和
ConvLSTM

d
网络,
ConvLSTM

s
网络和
ConvLSTM

d
网络为针对不同的工况训练得到的网络,随机森林模型将划分好工况的稳态时序数据送入
ConvLSTM

s
网络,将动态时序数据送入
ConvLSTM

d
网络

[0016]更进一步地,生成随机森林的步骤如下:
[0017](1)
将时序数据训练样本
D
分为
k
组,提取每组数据中均值

标准差

极值差

斜率均值和斜率极值,将其作为该组数据的特征属性;
[0018](2)
通过重采样的方法对数据
D
进行有放回的
m
次抽样,生成
m
个训练子集
S

[0019](3)
从所述5个特征属性中随机选取
w
个,对各个训练子集
S
构造决策树;
[0020](4)
重复进行
M
次重采样和特征选取,构造
M
个决策树,构造的决策树组成所述的随机森林

[0021]更进一步地,将传感器采集的多维时序数据输入随机森林,对各决策树的辨识结果采用基于集成投票的方法,选出票数最多的数据状态,得到辨识结果,该辨识结果即代表数据为稳态数据还是动态数据

[0022]更进一步地,所述的
ConvLSTM

s
网络使用一个全卷积编码器来编码多传感器间的相似度矩阵,该全卷积编码器包括
Conv1

Conv4
卷积层,卷积核大小分别为
32
个3×3×3,
64
个3×3×
32

128
个2×2×
64

256
个2×2×
128
,步长分别为1×1,2×2,2×2,2×
2。
[0023]更进一步地,
ConvLSTM

s
网络将
t

h

t
时刻的输入作为网络输入,计算其在
l
层卷积上的隐含层状态,计算出更新状态利用计算的对每个时刻和该时刻前5个时刻点,计算注意力权重系数,得到新的隐含层特征矩阵然后对得到的特征本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种电力时序数据异常检测方法,其特征在于,其步骤为:步骤一

通过火电机组设置的多种传感器,采集火电机组运行过程中的多维时序数据;步骤二

建立融合随机森林和注意力机制的
ConvLSTM
网络结构模型,并对模型进行训练;步骤三

通过训练的模型实现对步骤一采集的多维时序数据的检测和上送,判断该数据是否为异常数据,并做出标记,并用于后续的生产决策
。2.
根据权利要求1所述的一种电力时序数据异常检测方法,其特征在于:步骤二所述的模型包括随机森林模型和
ConvLSTM
模型,随机森林模型确定火电机组当前所处的机组工况为稳态还是动态;并将划分好工况的时序数据送入
ConvLSTM
模型进行分别处理,处理结果再通过最小损失函数计算结果与阈值之间的关系,确定该数据是否为异常数据,并做出标记
。3.
根据权利要求2所述的一种电力时序数据异常检测方法,其特征在于:所述
ConvLSTM
模型包括
ConvLSTM

s
网络和
ConvLSTM

d
网络,
ConvLSTM

s
网络和
ConvLSTM

d
网络为针对不同的工况训练得到的网络,随机森林模型将划分好工况的稳态时序数据送入
ConvLSTM

s
网络,将动态时序数据送入
ConvLSTM

d
网络
。4.
根据权利要求3所述的一种电力时序数据异常检测方法,其特征在于:生成随机森林的步骤如下:
(1)
将时序数据训练样本
D
分为
k
组,提取每组数据中均值

标准差

极值差

斜率均值和斜率极值,将其作为该组数据的特征属性;
(2)
通过重采样的方法对数据
D
进行有放回的
m
次抽样,生成
m
个训练子集
S

(3)
从...

【专利技术属性】
技术研发人员:黄刘松王杰张飞吕家伟黄莺吴慧林王子潇张梦
申请(专利权)人:马鞍山师范高等专科学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1