基于LDA主题模型的往复机械异常检测方法技术

技术编号:13229426 阅读:59 留言:0更新日期:2016-05-13 12:07
基于LDA主题模型的往复机械异常检测方法属于设备故障检测领域。其特征包括如下步骤:1)采集往复机械正常运行振动数据和实时运行振动数据;2)提取数据特征集;3)特征集预处理,包括数据归一化和离散化;4)设定主题模型个数;5)构造数据集;6)用往复机械正常数据的数据集训练主题模型并计算主题分布;7)用步骤6)主题模型对实时运行数据的数据集主题分布进行预测;8)计算实时运行数据的数据集和正常数据的数据集主题分布的JS距离。本发明专利技术首次将主题模型用于往复机械异常检测,该方法具有实时性,准确率高等优点,适用于往复机械异常检测。

【技术实现步骤摘要】

本专利技术属于设备故障检测领域,涉及针对往复机械的异常检测方法,具体是一种 基于LDA主题模型的往复机械异常检测方法
技术介绍
往复机械是流程工业重要设备之一,应用广泛,尤其在炼油、化工、输气管道行业 中起着至关重要的作用。由于结构复杂,振动激励源多,故障检测准确率低,重大事故频发。 一旦发生故障,轻则影响生产,重则机毁人亡,因此如何对往复机械进行实时智能状态监 测,及时发现异常,成为当前研究的热点。 目前国内往复机械的故障检测主要集中在气阀故障,对往复机械其他重大故障异 常检测方法的研究相对较少,且异常检测方法主要包括支持向量机,神经网络等,这些方法 虽然在往复机械异常检测方面取得了一些成果,但是还存在很多不足,比如,这些方法没有 很好的从故障机理出发,使检测准确率较低;检测过程需要较大的数据量,而很多故障数据 样本缺乏等,因此往复机械异常检测一直是故障检测领域的难点。 近年来,随着机器学习的发展,LDA主题模型受到越来越多的关注,该方法目前主 要用于文本分类和检索,且取得了很好的效果。因此,将LDA主题模型与往复机械异常检测 相结合,研发了一种基于主题模型的往复机械异常检测方法,该方法适用于往复机械多种 故障的异常检测,包括活塞杆断裂,拉缸,撞缸,大头瓦磨损等重大故障。
技术实现思路
本专利技术的目的是克服现有技术缺点,将主题模型与状态监测技术相结合,提供一 套全新的,智能的,实时的,准确的往复机械异常检测方法。该方法首次将主题模型用于往 复机械异常检测,能够在不停车的情况下应用实时监测数据,监测往复机械运行状态,准确 率高,适用于往复机械异常检测。 本专利技术公开了一种基于主题模型的往复机械异常检测方法,具体步骤为: 步骤1采集机组正常工况振动数据和实时运行振动数据:通过安装在往复机械上的加 速度传感器采集往复机械实时振动数据和正常工况振动数据; 步骤2提取数据特征集:当往复机械组发生异常时,一般振动数据也会同时发生变 化,因此可应用振动数据对往复机械进行异常检测;将振动数据带入特征值计算公式,求解 特征值。主要提取了如下特征值:波形的均值、峰值、方根幅值、均方值、有效峰值、标准差、 歪度指标、峭度指标、峰值指标、裕度指标、波形指标、脉冲指标、小波包分解后各个频带的 能量值、峰值和峰峰值。 步骤3特征集预处理:特征集预处理主要包括对特征值进行归一化和离散化处理。 数据离散化是将正常工况数据归一化后,计算每种特征值的均值μ和方差设定每种特征 值的报警值Α和危险值04 =以+2*〇,0 =以+4*〇,依据报警值4和危险值0将每种特征划分为词 库中的3个词1,2,3,特征对应的特征值小于等于报警值A时,定义该特征为1;大于报警线A, 小于等于危险线D时,定义该特征为2;大于危险线D时,定义该特征为3。将每个特征离散化 的结果进行联合,得到一个离散化后的特征集W。步骤4设定主题模型个数T:确定最优T的简单方法就是用不同的T重复实验,当分 类正确率最优时,即正常数据集的JS距离在报警线以下的比例,和故障数据集JS距离在报 警线以上的比例值最大,认为此时的T是模型数的最佳选择。通过试验确定主题模型为6-10 时效果较好。步骤5构造数据集:选择8组以上(含8组)离散化后的特征集作为一个数据集。 步骤6训练主题模型,计算主题分布:将机组正常数据数据集输入主题模型程序, 建立正常工况主题模型,并计算主题模型的主题分布|。采用Gibbs采样方法计算主题模型 参数,α、β是主题模型语料库级模型参数,需要提前设置。α初始值为50/Τ,β初始值为0.01,T 为主题模型数。 将每个数据集离散化后的特征集W输入主题模型程序,得到正常工况数据主题模型,并 计算主题模型的主题分布^。主题模型由一个或多个主题组成,每个主题为词库中多个词 的联合概率分布p,一个或多个主题出现的联合概率分布为4。 步骤7预测实时运行数据主题分布:用步骤6)中计算得到的主题预测实时运行数 据主题分布g。将步骤6中计算得到的主题模型参数,包括每个主题出现的词汇和词汇的联 合概率分布,输入至主题分布预测程序,得到实时运行数据的主题分布$。 步骤8计算实时运行数据和正常数据主题分布的JS距离:将主题分布Θ4Ρ主题分 布02代入JS距离计算公式,计算实时运行数据和正常数据主题分布的JS距离,并将正常数 据JS距离最大值设为报警线。计算运行数据和正常数据主题分布的JS距离,并将正常数据 JS距离最大值设为报警线。JS距离计算公式如下: D 人士 /=| 气 将上述公式带入下式,得到JS距离。 > 1 > Ο Λ- 0 > Θ + Θ D,、咚 4) = (心 ~(心 γ)] 其中0^和02」分别为机组正常工况数据的主题分布值|和运行采集的实时数据的主题 分布值4:中」个主题出现的概率值,即5=(44.2,4~".4/),在 =(心,爲2,%一·^ 设定的主题数。 本专利技术首次将主题模型用于往复机械异常检测,该方法在往复机械工作状态下即 可进彳丁异常检测,具有实时性强,准确率尚等特点。 本专利技术的第一方面,公开了用于往复机械异常检测的联合特征值; 本专利技术的第二方面,公开了特征值离散化方法。 本专利技术的第三方面,公开了基于主题模型的往复机械异常检测流程。本专利技术的第四方面,公开了主题分布JS离散度计算方法。【附图说明】图1:异常检测流程图 图2:振动波形 图3:特征值图 图4:归一化特征集图 图5:离散化结果图 图6 JS距离(1-14组为正常数据)【具体实施方式】 下面将结合附图对本专利技术的具体的异常检测流程做进一步说明。 如图1所示,本专利技术具体的流程如下所示: 1、采集机组正常工况振动数据和实时运行振动数据:通过往复机械在线监测系统,应 用加速度传感器采集往复机械实时振动数据和正常工况下的实时运行振动数据; 2、提取数据特征集:当往复机械组发生异常时,一般振动数据也会同时发生变化, 因此可应用振动数据对往复机械进行异常检测;将振动数据带入特征值计算公式,求解特 征集。主要提取了如下特征值:波形的均值、峰值、方根幅值、均方值、有效峰值、标准差、歪 度指标、峭度指标、峰值指标、裕度指标、波形指标、脉冲指标、小波包分解后各个频带的能 量值、峰值和峰峰值。 3、特征集预处理:特征集预处理主要包括对特征值进行归一化和离散化处理。数 据离散化是将正常工况数据归一化后,计算每种特征值的均值μ和方差设定每种特征值 的报警值Α和危险值D,Α = μ+2*σ,? = μ+4*σ,依据报警值Α和危险值D将每种特征划分为词库 中的3个词1,2,3,特征对应的特征值小于等于报警值A时,定义该特征为1;大于报警线A,小 于等于危险线D时,定义该特征为2;大于危险线D时,定义该特征为3。将每个特征离散化的 结果进行联合,得到一个离散化后的特征集W。 4、设定主题模型个数T:确定最优T的简单方法就是用不同的T重复实验,当分类正 确率最优时,即正常数据集的JS距离在报警线以下的比例,和故障数据集JS距离在报警线 以上的比例值最大,认为此时的T是模型数的最佳选择。通过试验确定主题模型为6-10时效 果较好。 5、构造数据集:选择8组以上(含8组)离散化后的特征集作为一个本文档来自技高网...

【技术保护点】
基于LDA主题模型的往复机械异常检测方法,其特征在于包括如下步骤:1)采集机组正常工况振动数据和实时运行振动数据:通过安装在往复机械上的加速度传感器采集往复机械实时振动数据和正常工况振动数据;2)提取数据特征集:当往复机械发生异常时,一般振动数据也会同时发生变化,因此可应用振动数据对往复机械进行异常检测;将振动数据带入特征值计算公式,求解特征集;3)特征集预处理:特征集预处理主要包括对特征值进行归一化和离散化处理,得到离散化后的特征集;4)设定主题模型个数T:主题模型为6‑10;5)构造数据集:选择8组以上离散化后的特征集作为一个数据集;6)训练主题模型,计算主题分布:将每个数据集离散化后的特征集输入主题模型程序,建立正常工况数据主题模型,并计算主题模型的主题分布7)预测实时运行数据主题分布:用步骤6)中计算得到的主题预测运行数据的主题分布8)计算实时运行数据和正常数据主题分布的JS距离:将主题分布和主题分布代入JS距离计算公式,计算实时运行数据和正常数据主题分布的JS距离,并设定报警线。

【技术特征摘要】

【专利技术属性】
技术研发人员:马波张颖江志农
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1