一种基于半监督对比学习的旋转设备小样本故障诊断方法技术

技术编号:39602366 阅读:11 留言:0更新日期:2023-12-03 20:02
本发明专利技术提供一种基于半监督对比学习的旋转设备小样本故障诊断方法,包括如下步骤:

【技术实现步骤摘要】
一种基于半监督对比学习的旋转设备小样本故障诊断方法


[0001]本专利技术属于滚动轴承故障诊断
,具体涉及一种基于半监督对比学习的旋转设备小样本故障诊断方法


技术介绍

[0002]在现代工业生产中,大型旋转设备扮演者重要的角色

然而,随着这些设备的复杂性不断增加,机械故障诊断对于工业设备的重要性也日益突出

在实际运行中,准确检测机械故障能够降低经济损失和事故发生的概率

随着人工智能技术的迅猛发展,许多算法开始应用于机械故障诊断领域

人工智能的诊断方法与传统方法有所不同,传统方法更依赖于专家知识和经验,而基于深度学习的智能诊断方法在近年来迅速发展,与传统的机器学习方法
(
如支持向量机
、K
均值和决策树
)
相比,深度学习方法具备更强大的特征提取能力,无需进行人工特征工程,降低了建模的难度,并提高了故障诊断的性能

一些常见的深度学习方法包括自动编码器

卷积神经网络和递归神经网络等,在有足够标记样本的情况下已经广泛应用于机械故障诊断,并取得了良好的性能,然而,在实际设备运行过程中,所采集的数据大多是健康数据,而各类故障数据的数量往往远少于健康数据

此外,故障样本往往没有标签或者只有很少的标签,这种情况非常常见

因此,仅有少量标记的故障数据可用于模型训练,导致模型难以学习到有效的判别特征信息
>。
[0003]近年来,针对小样本情况下的故障诊断问题取得了一些进展,比如度量学习和对比学习被广泛应用于小样本任务

其中,原型网络
(Prototypica lnetworks)
作为基于度量的机器学习方法,通过学习每类样本的特征原型并计算这些原型与测试样本之间的距离来完成分类任务

通过计算样本距离,模型可以快速将未知样本与正确的类别进行匹配

在原型学习步骤中,特征提取和距离计算对于学习不同类的原型具有重要意义

除此以外,基于对比学习的训练策略,可以在不生成新数据的情况下实现数据增强,通过样本差异性引导模型训练,在较小的数据量下模型也能够达到良好的泛化性能

半监督学习确实是解决数据稀缺问题的另一种有效途径

在小样本问题中,虽然标记数据非常有限,但存在大量的无标签数据可用,而半监督学习方法可以充分利用这些无标签数据来增强模型的泛化能力和性能,半监督学习和原型网络的结合是用于故障诊断的一个新思路,利用伪标签学习来解决支撑数据太少导致原型精度不够的问题


技术实现思路

[0004]本专利技术要解决的技术问题是提供一种基于半监督对比学习的旋转设备小样本故障诊断方法,解决旋转机械设备故障数据稀缺导致的模型过拟合和诊断精度不够的问题

[0005]为解决上述技术问题,本专利技术的实施例提供一种基于半监督对比学习的旋转设备小样本故障诊断方法,包括如下步骤:
[0006]S1、
构建两阶段训练数据集:
[0007]S1.1、
构建基于对比学习的正负样本对,记为预训练数据集;
[0008]S1.2、
构建基于小样本学习的任务数据集;
[0009]S2、
利用预训练数据集预训练改进的自动编码器,将
S1.2
构建的任务数据输入预训练后的自动编码器和原型网络中得到初始化原型;
[0010]S3、
使用预训练后的自动编码器对标记数据计算类别原型,对无标签样本计算类别贡献度和样本权重,联合无标签样本的类别贡献度和样本权重优化各类故障的类别原型

[0011]其中,步骤
S1.1
中,将相同标签数据构建成正样本对,不同标签数据构建成负样本对

[0012]进一步,步骤
S1.1
的具体步骤为:
[0013]首先收集所有标记样本
D
labeled
,标签
y∈{0,1,2,

N}
,将其中任意两个标记样本组成一个样本对
X
ij

{x
i
,x
j
}
,如果
y
i
≠y
j
,则此样本对为负样本对,样本对标签为
Y
ij
=0;否则为正样本对,标签为
Y
ij

1。
[0014]其中,步骤
S1.2
的具体步骤为:
[0015]以任务为基础单元,每个任务数据集包含支撑集
D
s

查询集
D
q
和无标记集
D
u
三部分,先从标记数据中随机采样出
N
c
×
N
s
个样本作为支撑集
D
s
,其中,
N
c
为类的数目,
N
s
为支撑集每个类别中的样本个数;然后从剩下的数据中随机采样
N
c
×
N
s
个样本作为查询集
D
q
,其余的无标签数据作为无标记集
D
u

[0016]其中,步骤
S2
中,改进的自动编码器包括编码器

卷积注意力机制模块
CBAM
和解码器,其中,
[0017]所述编码器对预训练数据集进行降维,获得低维度的故障信息,即嵌入特征;
[0018]所述卷积注意力机制模块
CBAM
用于加强特征筛选能力;
[0019]所述解码器包括三层反卷积模块,对嵌入特征进行数据重构;
[0020]卷积注意力机制模块
CBAM
由一个串联通道注意力模块和空间注意力模块串联组成,依次沿通道和空间两个维度计算注意力图,然后将注意力图乘以输入特征图进行自适应特征筛选;结合卷积注意力机制模块
CBAM
的编码器和解码器的计算过程如下:
[0021][0022][0023]其中,
x
s
∈R
C
×
W
为输入的原始样本;
F(
·
)
为编码映射函数;
f
CB
(
·
)
为一个卷积模块,由卷积层

批量归一化层和
ReLU
激活函数组成;
x
e
为编码器输出;
G(
·
)
为解本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,包括如下步骤:
S1、
构建两阶段训练数据集:
S1.1、
构建基于对比学习的正负样本对,记为预训练数据集;
S1.2、
构建基于小样本学习的任务数据集;
S2、
利用预训练数据集预训练改进的自动编码器,将
S1.2
构建的任务数据输入预训练后的自动编码器和原型网络中得到初始化原型;
S3、
使用预训练后的自动编码器对标记数据计算类别原型,对无标签样本计算类别贡献度和样本权重,联合无标签样本的类别贡献度和样本权重优化各类故障的类别原型
。2.
根据权利要求1所述的基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,步骤
S1.1
中,将相同标签数据构建成正样本对,不同标签数据构建成负样本对
。3.
根据权利要求1所述的基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,步骤
S1.1
的具体步骤为:首先收集所有标记样本
D
labeled
,标签
y∈{0,1,2,

N}
,将其中任意两个标记样本组成一个样本对
X
ij

{x
i
,x
j
}
,如果
y
i
≠y
j
,则此样本对为负样本对,样本对标签为
Y
ij
=0;否则为正样本对,标签为
Y
ij

1。4.
根据权利要求1所述的基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,步骤
S1.2
的具体步骤为:以任务为基础单元,每个任务数据集包含支撑集
D
s

查询集
D
q
和无标记集
D
u
三部分,先从标记数据中随机采样出
N
c
×
N
s
个样本作为支撑集
D
s
,其中,
N
c
为类的数目,
N
s
为支撑集每个类别中的样本个数;然后从剩下的数据中随机采样
N
c
×
N
s
个样本作为查询集
D
q
,其余的无标签数据作为无标记集
D
u
。5.
根据权利要求1所述的基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,步骤
S2
中,改进的自动编码器包括编码器

卷积注意力机制模块
CBAM
和解码器,其中,所述编码器对预训练数据集进行降维,获得低维度的故障信息,即嵌入特征;所述卷积注意力机制模块
CBAM
用于加强特征筛选能力;所述解码器包括三层反卷积模块,对嵌入特征进行数据重构;卷积注意力机制模块
CBAM
由一个串联通道注意力模块和空间注意力模块串联组成,依次沿通道和空间两个维度计算注意力图,然后将注意力图乘以输入特征图进行自适应特征筛选;结合卷积注意力机制模块
CBAM
的编码器和解码器的计算过程如下:的编码器和解码器的计算过程如下:其中,
x
s
∈R
C
×
W
为输入的原始样本;
F(
·
)
为编码映射函数;
f
CB
(
·
)
为一个卷积模块,由卷积层

批量归一化层和
ReLU
激活函数组成;
x
e
为编码器输出;
G(
·
)
为解码映射函数;为反卷积模块,由反卷积层

批量归一化层和激活函数组成;
自编码器重构误差
loss
rc
计算如下:
6.
根据权利要求1所述的基于半监督对比学习的旋转设备小样本故障诊断方法,其特征在于,步骤
S2
中,对比学习训练框架为:首先将步骤
S1
‑1中构建的样本对
X
ij

{x
i

...

【专利技术属性】
技术研发人员:袁烨张永程舒烈王茂霖周炜
申请(专利权)人:元始智能科技南通有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1