基于多尺度集成LightGBM的小样本故障诊断方法技术

技术编号:38828472 阅读:37 留言:0更新日期:2023-09-15 20:07
本发明专利技术公开了基于多尺度集成LightGBM的小样本故障诊断方法,包括以下步骤:采集旋转机械的振动加速度信号并截取样本,得到训练集和测试集;构建由数据增强模块、标签分类模块和输出加权模块组成的多尺度集成模型;在数据增强模块,利用多尺度滑动窗口对原始样本进行重采样,得到多个子样本训练集和子样本测试集;在训练阶段,利用子样本训练集训练标签分类模块中的多组分类器;在测试阶段,将子样本测试集分别输入对应组别的分类器中,通过集成得到标签分类模块对原始样本的测试结果;利用度量函数计算测试集与训练集样本在频域上的相似度,并作为权重;在输出加权模块,对集成后的测试结果进行加权,得到最终的分类诊断结果。果。果。

【技术实现步骤摘要】
基于多尺度集成LightGBM的小样本故障诊断方法


[0001]本专利技术属于旋转机械智能故障诊断领域,具体涉及一种基于多尺度集成LightGBM的小样本故障诊断方法。

技术介绍

[0002]随着现代工业技术的不断进步,机械设备正朝着大型化、复杂化和智能化的方向快速发展。然而,机械零部件在运行过程中难免会出现损伤,进而导致设备故障。这些故障不仅会延误生产进程,还可能造成严重的安全事故,给企业和社会带来巨大损失。为确保机械设备能够稳定高效运行,机械智能故障诊断技术作为一种可行的解决方案在近年来备受关注,现已成为智能制造领域中不可或缺的技术之一。作为机械设备中的核心部件,旋转机械通常工作在高温、重载等恶劣环境下,相较于其他零部件而言更容易出现损伤。因此,为旋转机械开展智能故障诊断研究,对于保障机械设备稳定高效运行,减少或避免重大事故发生,具有重要而深远的意义。
[0003]机械的智能故障诊断通常需要大量的数据来建立准确可靠的机器学习模型。然而,在实际的工业环境中,往往很难在旋转机械上获取到充足的故障数据,主要包括以下几方面原因:(1)旋转机械的退化需要数月甚至数年的时间,其故障发生的概率较低,特别是对于一些精密和复杂的机械设备而言,如航空发动机等;(2)当故障发生时,机械设备将被要求立即停机以确保安全,此时传感器仅能采集到十分有限的故障数据。(3)故障数据的标注需要耗费高昂的成本,包括人力、时间和经济资源等方面的开销。
[0004]为了应对上述故障数据稀缺的困境,一些适用于小样本故障诊断的方法被开发出来。其中,基于迁移学习和元学习的方法在近年来成为了该领域的研究重点。例如,下述基于迁移学习的小样本故障诊断方法通过利用数据充足的源域来辅助模型训练,将具有普遍性的知识从源域迁移到数据稀缺的目标域中,从而有效提高了模型在小样本目标域的故障诊断性能。
[0005]石静雯,侯立群.基于一维卷积注意力门控循环网络和迁移学习的轴承故障诊断[J].振动与冲击,2023,42(03):159

164.
[0006]虽然此类迁基于移学习或元学习的方法已被证明可以很好地解决小样本故障诊断问题,但仍需要足够多的标记故障数据来构建用于辅助模型训练的源域,并且模型对目标域的诊断精度受源域与目标域之间数据分布相似度的影响。而在实际的工业环境中,获取大量与小样本目标域相似的故障数据来构建源域无疑是十分困难的。另一方面,采用人工模拟获得故障数据的方法同样需要花费巨大的经济和时间成本,且人工故障与真实故障之间不可避免地存在差异,使得模型对于真实故障的诊断性能难以得到保证。

技术实现思路

[0007]为了解决现有技术存在的问题,本专利技术提出了一种基于多尺度集成LightGBM的旋转机械小样本故障诊断方法,该方法由数据增强模块、标签分类模块和输出加权模块组成。
在数据增强模块,多尺度滑动窗口被用于对原始样本进行重采样,获得大量具有不同尺度信息的子样本,从而实现数据扩充,避免模型训练时发生过拟合。在标签分类模块,扩充后的数据被用于训练多个LightGBM分类器,同时这些分类器被进一步集成为一个强分类模型。通过集成,每个LightGBM分类器所产生的诊断误差被削弱了,使得集成模型能够表现出更好的诊断性能和泛化性能。在输出加权模块,基于相似度度量的加权策略被用于为集成模型输出的诊断结果进行加权,以进一步提高诊断精度。本专利技术无需依赖额外跨域知识,仅需使用少量标记样本训练模型,即可实现有效的旋转机械小样本故障诊断。
[0008]本专利技术至少通过如下技术方案之一实现。
[0009]基于多尺度集成LightGBM的小样本故障诊断方法,包括以下步骤:
[0010]步骤1、数据集的采集与标定:采集旋转机械在某个实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,选择其中若干个样本组成训练集其余样本组成测试集其中,x
i
和y
i
分别表示第i个样本及其对应的标签,k为训练集的样本数量,m为样本总数;
[0011]步骤2、构建基于集成学习的小样本故障诊断模型,包括数据增强模块M
A
、标签分类模块M
C
和输出加权模块M
W
,其中,数据增强模块M
A
用于为样本进行多尺度重采样,以实现数据扩充;标签分类器模块M
C
用于为样本进行分类诊断,并输出相应的类别预测向量;输出加权模块M
W
用于为上述类别预测向量进行加权,以提高分类诊断的准确率;
[0012]步骤3、数据增强:将步骤1构建的训练集D
train
和测试集D
test
分别输入数据增强模块M
A
,利用多尺度滑动窗口对原始样本进行重采样,获得大量尺度不一的子样本,并相应地构建多个具有不同尺度信息的子样本训练集和子样本测试集其中,和分别表示具有第j种尺度信息的子样本训练集和子样本测试集,T表示尺度的类别数量;
[0013]步骤4、模型训练:在标签分类模块M
C
,对于步骤3中获得的每个子样本训练集,都采用梯度提升决策树算法分别训练一组基于轻量级梯度提升机(LightGBM)的标签分类器,共训练T组,其中,每组标签分类器都包含N个用于二分类的LightGBM模型,N即为标签的类别数量;
[0014]步骤5、模型测试:在标签分类模块M
C
,将步骤3中获得的每个子样本测试集都分别输入对应组别的标签分类器,各组标签分类器输出测试结果,对测试结果进行加和求平均及拼接操作后得到T组N维的类别预测向量,将各组类别预测向量进行进一步的加和求平均,得到集成后类别预测向量,即标签分类模块M
C
对测试集D
test
输出的诊断结果;
[0015]步骤6、权重计算:利用快速傅里叶变换将步骤3中获得的训练集D
train
和测试集D
test
中的样本从时域转换至频域,得到新的频域训练集D
train

f
和频域测试集D
test

f
,将频域训练集D
train

f
中的样本按类别进行加和求平均,得到N个类别中心,采用余弦相似度函数作为度量函数,计算频域测试集D
test

f
中的样本与各个类别中心的相似度,得到N维的度量向量,再将度量向量进行归一化,最终得到N维的权重向量;
[0016]步骤7、输出加权:在输出加权模块M
C
,将步骤5、步骤6中获得的集成后的N维类别预测向量与对应的N维权重向量逐分量相乘,得到加权后的类别预测向量,其中最大的向量分量对应的类别即为整体模型对测试集D
test
的最终诊断结果。
[0017]进一步地,步骤1中,从振动加速度信号本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多尺度集成LightGBM的小样本故障诊断方法,其特征在于,包括以下步骤:步骤1、数据集的采集与标定:采集旋转机械在某个实验工况下的振动加速度信号,从振动加速度信号中截取数据段来构成样本,并进行标注,选择其中若干个样本组成训练集其余样本组成测试集其中,x
i
和y
i
分别表示第i个样本及其对应的标签,k为训练集的样本数量,m为样本总数;步骤2、构建基于集成学习的小样本故障诊断模型,包括数据增强模块M
A
、标签分类模块M
C
和输出加权模块M
W
,其中,数据增强模块M
A
用于为样本进行多尺度重采样,以实现数据扩充;标签分类器模块M
C
用于为样本进行分类诊断,并输出相应的类别预测向量;输出加权模块M
W
用于为上述类别预测向量进行加权,以提高分类诊断的准确率;步骤3、数据增强:将步骤1构建的训练集D
train
和测试集D
test
分别输入数据增强模块M
A
,利用多尺度滑动窗口对原始样本进行重采样,获得大量尺度不一的子样本,并相应地构建多个具有不同尺度信息的子样本训练集和子样本测试集其中,和分别表示具有第j种尺度信息的子样本训练集和子样本测试集,T表示尺度的类别数量;步骤4、模型训练:在标签分类模块M
C
,对于步骤3中获得的每个子样本训练集,都采用梯度提升决策树算法分别训练一组基于轻量级梯度提升机(LightGBM)的标签分类器,共训练T组,其中,每组标签分类器都包含N个用于二分类的LightGBM模型,N即为标签的类别数量;步骤5、模型测试:在标签分类模块M
C
,将步骤3中获得的每个子样本测试集都分别输入对应组别的标签分类器,各组标签分类器输出测试结果,对测试结果进行加和求平均及拼接操作后得到T组N维的类别预测向量,将各组类别预测向量进行进一步的加和求平均,得到集成后类别预测向量,即标签分类模块M
C
对测试集D
test
输出的诊断结果;步骤6、权重计算:利用快速傅里叶变换将步骤3中获得的训练集D
train
和测试集D
test
中的样本从时域转换至频域,得到新的频域训练集D
train

f
和频域测试集D
test

f
,将频域训练集D
train

f
中的样本按类别进行加和求平均,得到N个类别中心,采用余弦相似度函数作为度量函数,计算频域测试集D
test

f
中的样本与各个类别中心的相似度,得到N维的度量向量,再将度量向量进行归一化,最终得到N维的权重向量;步骤7、输出加权:在输出加权模块M
C
,将步骤5、步骤6中获得的集成后的N维类别预测向量与对应的N维权重向量逐分量相乘,得到加权后的类别预测向量,其中最大的向量分量对应的类别即为整体模型对测试集D
test
的最终诊断结果。2.根据权利要求1所述的基于多尺度集成LightGBM的小样本故障诊断方法,其特征在于,步骤1中,从振动加速度信号截取样本时,各样本的数据点之间无重叠,此外,训练集D
train
和测试集D
test
的数据特征分布相同,且标签空间相同。3.根据权利要求1所述的基于多尺度集成LightGBM的小样本故障诊断方法,其特征在于,步骤2中,数据增强模块M
A
采用多尺度滑动窗口重采样的方法实现数据增强,标签分类模块M
C
包括多个用于二分类的LightGBM模型,输出加权模块M
W
采用相似度度量策略实现类别预测向量加权。4.根据权利要求1所述的基于多尺度集成LightGBM的小样本故障诊断方法,其特征在于,步骤3中利用多尺度滑动窗口对原始样本进行重采样时,窗口的尺度分别设置为原始样
本数据点长度...

【专利技术属性】
技术研发人员:李巍华何敬科陈祝云许维冬贺毅
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1