基于Bagging和RM-LOF集成单分类器的管道压力信号异常检测方法技术

技术编号:35096653 阅读:10 留言:0更新日期:2022-10-01 17:00
本发明专利技术公开了基于Bagging和RM

【技术实现步骤摘要】
基于Bagging和RM

LOF集成单分类器的管道压力信号异常检测方法


[0001]本专利技术涉及一种基于Bagging和RM

LOF集成单分类器的管道压力信号异常检测方法,属于工业数据异常检测


技术介绍

[0002]在工业发展已经较为成熟的今天,我国正在大踏步地迈进工业4.0时代,工业过程的智能化异常检测在这个进程中扮演着重要角色。工业过程中异常状况的产生往往会损失较大的经济、时间和人工成本,因此对工业过程进行智能化的异常检测,实时检测异常提前避免异常带来的损失有着重要意义。同时,随着信息技术的发展和计算设备、数据存储和收集设备的普及,工业过程中产生的大量数据得以保留,人们可以对这些数据进行挖掘来获取信息,满足工业生产需求。但在实际工业过程中经常存在的问题是:虽然数据量非常大,但是最有价值的一类数据占比却可能很小。在二类数据中,一类数据数量远低于另一类数据数量的数据集就是不平衡数据集;其中,少数类往往为异常类,多数类往往为正常类。以管道泄漏检测工程为例,由于大部分时间管道都属于正常运输流体的状态,只有当管道内流体流量突然增加或管道使用时间过长导致管道发生泄漏时才会产生异常声波或压力信号,管道泄漏检测过程采集的信号属于不平衡数据。因此,工业过程产生的不平衡信号数据的异常检测受到越来越多的关注,也成为了工程领域的研究重点。
[0003]Bagging(Bootstrap aggregating,引导聚集算法)是一种集成学习算法,可与其他分类算法结合,提高方法准确率和稳定性。RM

LOF算法是在LOF(Local Outlier Factor,局部离群因子)基础上改进其距离计算方式后所得算法的简称,具体为距离计算方式由原始距离改为基于ReliefF特征选择与融合距离(Multiple Distance Fusion)结合的RM距离。
[0004]异常检测本质上属于数据分类问题,正确选择分类建模方法可以提高异常检测的准确率。由于分类器建模时是以整体分类准确率为优化目标的,因此用不平衡数据训练分类器时,分类器有更大的概率偏向多数类。但是,在工业过程中,少数类(通常为异常信号)的漏检往往会造成较大的经济和时间成本的损失,因此少数类通常更加受到人们的重视。因此,针对工业过程不平衡数据异常检测问题,形成了诸多解决方案,其中单分类器在训练时只需用一种类别的样本即可实现数据建模,成为研究热点。

技术实现思路

[0005]本专利技术目的是针对实际工业过程产生的不平衡信号数据进行更准确、有效的异常检测。以LOF算法为基础,针对LOF单分类算法对数据集特征的敏感性问题,提出基于ReliefF与融合距离的改进LOF算法,并与集成学习算法结合,提高算法的分类准确率,最终实现异常检测。
[0006]本专利技术针对实际工业过程产生的不平衡信号数据提出了一种基于Bagging和RM

LOF集成单分类器的管道压力信号异常检测方法,该方法包括如下步骤:
[0007]步骤S1采集管道压力信号得到训练信号数据集和实时测试信号;
[0008]管道运输中,利用压力传感器采集管道压力信号,构建训练信号数据集;在管道实时运输过程中,实时在线采集管道运输的实时测试信号。其中,实时测试信号的采样频率为100Hz。
[0009]步骤S2计算训练信号集和测试信号集中每帧管道压力信号的时频域特征,得到训练信号特征集X和测试信号特征向量;
[0010]以管道压力信号的最大值max、峰峰值peak_to_peak、平均值mean、方差var、标准差std、偏度ske、峭度kur、五阶中心矩mom、功率谱重心Fcpy、小波包能量energ、小波包能量熵entropy特征构建信号特征向量,结合信号各个特征的具体含义,信号特征向量构建如下:
[0011]features=[max,peak_to_peak,|mean|,var,std,|ske|,kur,|mom|,Fcp,energy,|entropy|](1)
[0012]以十分钟内采集的管道压力信号(60000个数据点)为一帧信号,根据公式(1)计算步骤S1得到的训练信号数据集和实时测试信号中每帧信号的特征向量,构建训练信号特征集X和测试信号特征向量,为后续异常检测打下了基础。
[0013]步骤S3计算每帧管道压力信号特征向量间的RM距离,即计算信号A特征向量x和信号B特征向量y间RM距离。
[0014]步骤S31利用ReliefF算法为管道压力信号的每个特征计算出其相应权重,得到特征权重向量W。所述ReliefF算法为已有算法。
[0015]步骤S32根据特征权重向量W和特征权重阈值保留特征向量x,y权重高的前m维特征和其对应权重组成的权重向量W
s
,得到特征选择后的特征向量x
r
,y
r
,根据下式得到用于计算加权距离的特征权重向量W
r
[0016][0017]其中W
s
为去除冗余特征对应权重后的权重向量,W
r
为用于计算加权距离的特征权重向量,m为特征选择后特征向量的维数。
[0018]步骤S33根据计算得到的特征向量x
r
、y
r
和特征权重向量W
r
计算RM距离,如下:
[0019][0020]W
r
是特征向量x
r
、y
r
各个特征对应权重组成的特征权重向量。
[0021]步骤S4将RM距离引入LOF分类器,构建RM

LOF单分类器
[0022]应用于管道压力信号的RM

LOF单分类器的流程示意图如图1所示,其中各计算步骤使用的距离均为RM距离。RM

LOF单分类器主要分为离线建模和在线检测两个阶段。
[0023]离线建模阶段具体为:
[0024](1)计算步骤S2得到的训练信号特征集X中各帧信号间的RM距离,并在后续的距离计算中应用。
[0025](2)对于X中的每个特征向量x
i
,确定它的第k距离局部邻域N
k
(x
i
)。
[0026](3)记录邻域N
k
(x
i
)内的特征向量和x
i
的第k距离。
[0027](4)计算X中各特征向量间的可达距离。
[0028](5)计算x
i
局部可达密度。
[0029](6)计算每个训练信号特征向量x
i
的RM

LOF统计量并借助KDE(核概率密度估计)方法计算RM

LOF统计量的控制限。
[0030]在线检测阶段具体为:
[0031](1)计算步骤S2得到的测试信号特征向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于Bagging和RM

LOF集成单分类器的管道压力信号异常检测方法,其特征在于,该方法包括如下步骤:步骤S1采集管道压力信号得到训练信号数据集和实时测试信号;管道运输中,利用压力传感器采集管道压力信号,构建训练信号数据集;在管道实时运输过程中,实时在线采集管道运输的实时测试信号;步骤S2计算每帧管道压力信号的时频域特征,得到训练信号特征集X和测试信号特征向量;以管道压力信号的最大值max、峰峰值peak_to_peak、平均值mean、方差var、标准差std、偏度ske、峭度kur、五阶中心矩mom、功率谱重心Fcpy、小波包能量energ、小波包能量熵entropy特征构建信号特征向量,结合信号特征向量的具体含义,信号特征向量构建如下:features=[max,peak_to_peak,|mean|,var,std,|ske|,kur,|mom|,Fcp,energy,|entropy|]
ꢀꢀꢀꢀ
(1)以十分钟内采集的管道压力信号为一帧信号,根据公式(1)计算步骤S1得到的训练信号数据集和实时测试信号中每帧信号的特征向量,构建训练信号特征集X和测试信号特征向量;步骤S3计算每帧管道压力信号特征向量间的RM距离,即计算信号A特征向量x和信号B特征向量y间RM距离;步骤S31利用ReliefF算法为管道压力信号的每个特征计算出其相应权重,得到特征权重向量W;步骤S32根据特征权重向量W和特征权重阈值保留特征向量x,y权重高的前m维特征和其对应权重组成的权重向量W
s
,得到特征选择后的特征向量x
r
,y
r
,根据下式得到用于计算加权距离的特征权重向量W
r
其中W
s
为去除冗余特征对应权重后的权重向量,W
r
为用于计算加权距离的特征权重向量;步骤S33根据计算得到的特征向量x
r
、y
r
和特征权重向量W
r
计算RM距离,如下:W
r
是特征向量x
r
、y
r
各个特征对应权重组成的特征权重向量;步骤S4将RM距离引入LOF分类器,构建RM

LOF单分类器;应用于管道压力信号的RM

LOF单分类器的流程计算步骤中,使用的距离均为RM距离;RM

LOF单分类器主要分为离线建模和在线检测两个阶段;步骤S5将RM

LOF单分类器结合Bagging算法,构建基于Bagging和RM

LOF的集成单分类器,并将测试管...

【专利技术属性】
技术研发人员:吴海燕范国轩林伟国
申请(专利权)人:北京化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1