一种基于高维时序数据的故障特征参数提取方法技术

技术编号:39658071 阅读:12 留言:0更新日期:2023-12-09 11:27
本发明专利技术属于流程工业故障诊断领域,具体涉及一种基于高维时序数据的故障特征参数提取方法

【技术实现步骤摘要】
一种基于高维时序数据的故障特征参数提取方法


[0001]本专利技术属于流程工业故障诊断领域,具体涉及一种基于高维时序数据的故障特征参数提取方法


技术介绍

[0002]火电

核电

化工等流程工业中,通过采集海量运行参数,如温度

压力

液位等,监控系统运行

以火电为例,现代火电机组一般都配备了具有上万个测点的
DCS
系统,大量传感器测量数据形成了源源不断的信息流,并保存在历史数据库
(PI、eDNA

)
中,形成宝贵的数据资源

该信息流是火电厂的物质流和能量流的集中体现,这些数据直接反映了设备的运行状态;故障诊断的过程就是通过对数据的加工处理提取反映系统和设备运行的状态的过程

基于机器学习方法进行故障诊断的关键是构造故障样本

原始的故障样本是发生故障时一段时间内所有测量数据的集合,是高维时序数据,每个数据就是一个特征

在机器学习中,特征维度的增加,要覆盖同样的特征值范围

防止过拟合,所需训练样本数量就会成指数型增长,训练时间同样指数型增长,这就是所谓的“维度灾难”。
同时,不同故障只会引发部分参数变化,这些参数也并不是正交的,有着丰富的相关性

通过数据挖掘方法,寻找与具体故障关联的测量参数,并进行约简,制作精简的故障样本,是进行高效

准确的故障诊断的前提


技术实现思路

[0003]本专利技术的目的在于提供一种基于高维时序数据的故障特征参数提取方法,去除与故障无关的特征参数,并对相关特征进行约简,得到故障的最优特征样本,避免后续机器学习中的“维度灾难”,缩短机器学习训练过程,提高模型精度

[0004]本专利技术的技术方案如下:一种基于高维时序数据的故障特征参数提取方法,包括如下步骤:
[0005]步骤1:确定故障对应的样本数据集合;
[0006]步骤2:通过关联分析,去除与故障无关变量;
[0007]步骤3:通过聚类分析,将强相关的变量进行聚类;
[0008]步骤4:经过以上数据处理流程故障集的参数空间由
A
缩减至
A2。
[0009]所述的步骤1中故障的有限集合为
U
,流程工业系统中所有采集参数的集合为
A
,每次故障都从历史库读取故障发生后一段时间内所有参数的数据,则该故障对应的样本为数据集合
[0010]V
x

{v
x

a
|a∈A}

x∈U
[0011]其中
v
x

a
为发生故障
x
时参数
a
的时序数据集

[0012]所述的步骤2中将
U
中所有故障样本分别与同样时长的正常工况样本
V0进行比较,若某个特征参数
a
在所有采样点上与正常工况样本的对应值的差均小于指定阈值
δ1,即:
[0013]|v
x

a

v0,
a
|≤
δ1,
x∈U
[0014]得到所有与本故障集有关的参数
A1,有
[0015]所述的步骤3中,取变量
a
在所有故障样本中的值的集合为:
[0016]V
a

{v
x

a
|x∈U}

a∈A
[0017]计算任意两个变量
a1

a2
的所有值之间的相关系数
r
,如满足:
[0018]r(V
a1

V
a2
)

δ2[0019]则可认为这两个变量在所有故障中的数值变化都是强相关的,可以聚为一个子集,遍历计算,将变量集合
A
,划分为
M
个子集,每个子集内变量均为强相关,每个子集保留一个变量,组成新的变量集合
A2,有
[0020]所述的步骤4中,各故障样本中只需要保留
A2中的参数

[0021]本专利技术的有益效果在于:通过去除无关的特征,约简相似特征,可以减少样本空间的维数,提高数据的稠密度,不仅大大提高了模型的训练速度,还可以提高模型的训练精度;火电站

核电站等流程工业中,数据的采集和传输过程的是十分昂贵,通过特征约简,减少不必要的数据采集,降低成本

附图说明
[0022]图1为本专利技术所提供的一种基于高维时序数据的故障特征参数提取方法流程图

具体实施方式
[0023]下面结合附图及具体实施例对本专利技术作进一步详细说明

[0024]本专利技术基于数据挖掘,从流程工业运行中产成的高维时序数据,通过关联分析和维度约简,制作故障特征样本的方法

[0025]一种基于高维时序数据的故障特征参数提取方法,包括如下步骤:
[0026]步骤1:确定故障对应的样本数据集合
[0027]1.
设故障的有限集合为
U
,流程工业系统中所有采集参数的集合为
A。
每次故障都从历史库
(PI

)
读取故障发生后一段时间内
(
设采样次数为
M)
所有参数的数据

则该故障对应的样本为数据集合
[0028]V
x

{v
x

a
|a∈A}

x∈U
[0029]其中
v
x

a
为发生故障
x
时参数
a
的时序数据集
(
长度为
M)。
[0030]步骤2:通过关联分析,去除与故障无关变量
[0031]将
U
中所有故障样本分别与同样时长的正常工况样本
V0进行比较,若某个特征参数
a
在所有采样点上与正常工况样本的对应值的差均小于指定阈值
δ1,即:
[0032]|v
x

a

v0,
a
|≤
δ1,
x∈U
[0033]可以认为该特征参数与本故障集所有故障均无关,予以剔除

最后得到所有与本故障集有关的参数
A1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于高维时序数据的故障特征参数提取方法,其特征在于,包括如下步骤:步骤1:确定故障对应的样本数据集合;步骤2:通过关联分析,去除与故障无关变量;步骤3:通过聚类分析,将强相关的变量进行聚类;步骤4:经过以上数据处理流程故障集的参数空间由
A
缩减至
A2。2.
如权利要求1所述的一种基于高维时序数据的故障特征参数提取方法,其特征在于:所述的步骤1中故障的有限集合为
U
,流程工业系统中所有采集参数的集合为
A
,每次故障都从历史库读取故障发生后一段时间内所有参数的数据,则该故障对应的样本为数据集合
V
x

{v
x

a
|a∈A}

x∈U
其中,
v
x

a
为发生故障
x
时参数
a
的时序数据集
。3.
如权利要求1所述的一种基于高维时序数据的故障特征参数提取方法,其特征在于:所述的步骤2中将
U
中所有故障样本分别与同样时长的正常工况样本
V0进行比较,若某个特征参数
a
在所有采样点上与正常工况样本的对应值的差均小于指定阈值
δ1,即:
|v
x

a

v0,
a
|≤
δ1,
x∈U
得到所有与本故障集有关的参数
A1,有
4.
如权利要求1所述的一种基于高维时序数据的故障特征参数提取方法,其特征在于:所述的步骤3中,取变量
a
在所有故障样本中的值的集合为:
V
a

{v
x

a
|x∈U}

a∈A
计算任意两个变量
a1

a2
的所有值之间的相关系数
r
,如满足:
r(V
a1

V
a...

【专利技术属性】
技术研发人员:张大志齐克林刘伟景应刚
申请(专利权)人:核动力运行研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1