当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于联邦自监督学习的设备故障诊断方法技术

技术编号:39157088 阅读:13 留言:0更新日期:2023-10-23 15:01
本发明专利技术公开了一种基于联邦自监督学习的设备故障诊断方法。包括:首先,服务器初始化特征提取器的权重并下发至各个客户端;接着,各客户端利用传感器采集本地设备工作时产生的信号并记为本地振动数据,进而获得无标签数据集和有标签数据集;然后,各客户端在联邦自监督学习框架下分别训练本地特征提取器,进而获得训练好的本地特征提取器;接着各客户端在监督学习框架下分别训练分类器,获得对应的客户端分类器,连接特征提取器和客户端分类器形成故障诊断模型;最后,利用客户端的故障诊断模型进行设备诊断。本发明专利技术解决了旋转设备故障数据集较小、分散并且缺乏标签难以训练出高精度诊断模型的问题。诊断模型的问题。诊断模型的问题。

【技术实现步骤摘要】
一种基于联邦自监督学习的设备故障诊断方法


[0001]本专利技术属于旋转设备故障诊断领域,涉及到机器学习、深度学习和时间序列分类领域的一种设备故障诊断方法,具体涉及了一种基于联邦自监督学习的设备故障诊断方法。

技术介绍

[0002]旋转设备在现代工业中有着广泛的应用,并且变得越来越复杂,越来越精密,例如航空发动机、燃气轮机。当旋转设备出现轴承损坏、叶片断裂等故障时,可能导致严重的事故,造成巨大的经济损失。因此,正确识别运行中的设备状态,在出现故障早期征兆时就及时干预,对提高生产效率,减少灾难损失等方面都有着重要的意义。
[0003]目前的旋转设备故障诊断大都属于数据驱动方法,通过大量的数据,挖掘出振动信号到设备状态的映射关系。常用的方法包括支持向量机、决策树和神经网络等。深度神经网络因其有自动提取特征的能力,是目前主流的研究方向之一。如专利“一种基于机器学习的水泥生产旋转设备故障诊断方法”公开的方法使用了一维卷积神经网络和全连接神经网络提取振动特征,然后使用集成学习从多个分类器中获得诊断结果。专利“一种基于深度残差网络的旋转设备故障诊断方法、系统及可读存储介质”公开的方法则使用了深度残差网络从振动信号中提取故障特征。
[0004]现有的方法虽然从诊断精度上达到了相当高的水平,但是它们使用大尺寸的、完全标注的数据集训练模型,这在很多场合下是受到限制的。数据缺乏标注是最常见的限制。振动信号需要具备领域知识的专家进行标注,成本很高,在实际应用中,只有很少一部分数据被标注。数据安全也是需要考虑的。不同客户在不同工况下使用设备。为了确保模型鲁棒性,应该尽量收集所有客户的数据。但是客户可能出于利益考量或者对数据泄露风险的担忧,不愿意将自己的数据共享出来以供训练更优秀的模型。

技术实现思路

[0005]为了解决
技术介绍
中存在的问题和需求,本专利技术提出了一种基于联邦自监督学习的设备故障诊断方法,能够利用分散且无法共享的多个小型缺乏标签的数据集训练故障诊断模型并用于在线诊断。利用自监督学习方法从大量无标签数据中学习有效的故障特征表示,使用联邦学习方法从多个客户端处训练具有全局知识的故障诊断模型而不需要客户端上传本地数据,该方法可在故障数据集较小且分散、缺乏标签的场景下训练高效的故障诊断模型。
[0006]本专利技术的具体技术方案包括几下步骤:
[0007]S1:服务器初始化特征提取器的权重,并将该权重下发至各个客户端,各个客户端均使用该权重作为本地特征提取器的初始权重;
[0008]S2:各客户端利用传感器采集本地设备工作时产生的信号并记为本地振动数据,接着对本地振动数据进行预处理后,获得无标签数据集和有标签数据集;
[0009]S3:在联邦自监督学习框架下,各客户端使用无标签数据集训练本地特征提取器,进而获得训练好的本地特征提取器;
[0010]S4:各客户端在监督学习框架下分别使用标签数据集训练分类器,获得对应的客户端分类器,每个客户端中,由当前特征提取器与客户端分类器连接后形成故障诊断模型;
[0011]S5:将待诊断设备的传感器数据经过预处理后接入到对应客户端的故障诊断模型中,获得对应的设备诊断结果。
[0012]所述S1中,特征提取器采用带有残差连接的卷积神经网络。
[0013]所述S2中,每个客户端均执行以下步骤:
[0014]S21:利用加速度计采集本地设备工作时产生的信号并记为本地振动数据;
[0015]S22:随机选择预设比例的本地振动数据并按照设备真实状态对选择的本地振动数据进行标注,获得初始有标签数据集,未选择的本地振动数据则记为初始无标签数据集;
[0016]S23:使用滑动窗口分别将初始有标签数据集和无标签数据集的所有信号切分为多段,分别获得已切分的有标签数据集和无标签数据集;
[0017]S24:使用最大

最小方法分别将已切分的有标签数据集和无标签数据集进行数值缩放,获得最终的无标签数据集和有标签数据集。
[0018]所述S3具体为:
[0019]S31:每轮训练中,各客户端在自监督学习框架下分别使用无标签数据集训练本地特征提取器,获得当前轮训练后各客户端的本地特征提取器权重并均上传至服务器;
[0020]S32:服务器聚合全体客户端的本地特征提取器权重后,获得全局特征提取器权重并下发该权重至各客户端的本地特征提取器;
[0021]S33:重复S31

S32,进行多轮全局特征提取器权重的更新,直至达到预设轮次,将最终的全局特征提取器权重下发至各客户端的本地特征提取器,各客户端从而获得训练好的本地特征提取器。
[0022]所述S31中,每个客户端均执行以下步骤:
[0023]S311:利用两种不同的数据增强方法对无标签数据集中的各条无标签数据进行数据增强,获得对应的增强样本对;
[0024]S312:在自监督学习框架下使用无标签数据集对应的增强样本对数据集进行一轮本地特征提取器的训练,获得当前轮训练后的本地特征提取器的权重并上传至服务器。
[0025]所述S311中,第一数据增强样本是先为每条无标签数据添加高斯噪声,再对添加噪声的数据进行缩放后获得的;第二数据增强样本是先通过平滑地扭曲每条无标签数据的时间步的间隔,再施加噪声后获得的。
[0026]所述本地特征提取器在训练过程中,输出第一特征矩阵和第一特征矩阵使用梯度下降算法优化特征提取器权重,损失函数包括第一损失函数和第二损失函数,第一损失函数loss1的计算公式如下:
[0027][0028][0029][0030][0031]其中,N为批次大小,α,β分别为第一和第二超参数,为指示函数;i与j分别表示批次中样本的第一、第二索引;l
c
为上下文对比损失函数,l
t
为时间对比损失函数表示第一裁剪特征矩阵,表示第二裁剪特征矩阵,s1和s2分别表示第一和第二起始位置,e1和e2分别表示第一和第二结束位置;T表示特征矩阵时间维度的长度;表示第二裁剪特征矩阵中样本i在时间步t

的特征,表示第一裁剪特征矩阵中样本i在时间步t的特征,表示第一裁剪特征矩阵中的样本i,表示第二裁剪特征矩阵中的样本i,表示第二裁剪特征矩阵中的样本j;
[0032]第二损失函数loss2的计算公式如下:
[0033][0034]其中,分别表示第k个客户端第r轮的本地特征提取器提取的第一特征矩阵和第一特征矩阵分别表示第k个客户端第p轮的本地特征提取器提取的第一特征矩阵和第一特征矩阵表示每个客户端使用在第r轮训练时从服务器接收的全局特征提取器权重提取的特征。
[0035]所述S32中,服务器使用加权平均方法聚合全体客户端的本地特征提取器权重,计算公式如下:
[0036][0037]其中,k为客户端索引,|D|、|D
k
|分别表示全局客户端的数据量和第k个客户端的数据量,θ
G
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦自监督学习的设备故障诊断方法,其特征在于,包括以下步骤:S1:服务器初始化特征提取器的权重,并将该权重下发至各个客户端,各个客户端均使用该权重作为本地特征提取器的初始权重;S2:各客户端利用传感器采集本地设备工作时产生的信号并记为本地振动数据,接着对本地振动数据进行预处理后,获得无标签数据集和有标签数据集;S3:在联邦自监督学习框架下,各客户端使用无标签数据集训练本地特征提取器,进而获得训练好的本地特征提取器;S4:各客户端在监督学习框架下分别使用标签数据集训练分类器,获得对应的客户端分类器,每个客户端中,由当前特征提取器与客户端分类器连接后形成故障诊断模型;S5:将待诊断设备的传感器数据经过预处理后接入到对应客户端的故障诊断模型中,获得对应的设备诊断结果。2.根据权利要求1所述的一种基于联邦自监督学习的设备故障诊断方法,其特征在于,所述S1中,特征提取器采用带有残差连接的卷积神经网络。3.根据权利要求1所述的一种基于联邦自监督学习的设备故障诊断方法,其特征在于,所述S2中,每个客户端均执行以下步骤:S21:利用加速度计采集本地设备工作时产生的信号并记为本地振动数据;S22:随机选择预设比例的本地振动数据并按照设备真实状态对选择的本地振动数据进行标注,获得初始有标签数据集,未选择的本地振动数据则记为初始无标签数据集;S23:使用滑动窗口分别将初始有标签数据集和无标签数据集的所有信号切分为多段,分别获得已切分的有标签数据集和无标签数据集;S24:使用最大

最小方法分别将已切分的有标签数据集和无标签数据集进行数值缩放,获得最终的无标签数据集和有标签数据集。4.根据权利要求1所述的一种基于联邦自监督学习的设备故障诊断方法,其特征在于,所述S3具体为:S31:每轮训练中,各客户端在自监督学习框架下分别使用无标签数据集训练本地特征提取器,获得当前轮训练后各客户端的本地特征提取器权重并均上传至服务器;S32:服务器聚合全体客户端的本地特征提取器权重后,获得全局特征提取器权重并下发该权重至各客户端的本地特征提取器;S33:重复S31

S32,进行多轮全局特征提取器权重的更新,直至达到预设轮次,将最终的全局特征提取器权重下发至各客户端的本地特征提取器,各客户端从而获得训练好的本地特征提取器。5.根据权利要求4所述的一种基于联邦自监督学习的设备故障诊断方法,其特征在于,所述S31中,每个客户端均执行以下步骤:S311:利用两种不同的数据增强方法对无标签数据集中的各条无标签数据进行数据增强,获得对应的增强样本对;S312:在自监督学习框架下使用无标签数据集对应的增强样本对数据集进行一轮本地特征提取器的训练,获得当前轮训练后的本地特征提取器的权重并上传至服务器。6.根据权利要求5所述的一种基于联邦...

【专利技术属性】
技术研发人员:刘振宇郑皓文刘惠谭建荣
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1