一种基于动态联邦学习的设备故障诊断方法技术

技术编号:36223790 阅读:16 留言:0更新日期:2023-01-04 12:22
本发明专利技术公开了一种基于动态联邦学习的设备故障诊断方法,包括下述步骤:S1.搭建包含局部更新模块与中心聚合模块的联邦学习框架;S2.所有工厂子端对故障数据进行采集、归一化等数据处理;S3.在局部更新模块中构造子端SAC

【技术实现步骤摘要】
一种基于动态联邦学习的设备故障诊断方法


[0001]本专利技术涉及工业设备故障诊断及联邦学习
,尤其涉及一种基于动态联邦学习的设备故障诊断方法。

技术介绍

[0002]现代工业领域中的设备呈现向大型化、复杂化方向发展的新趋势,其正常运行关系到工厂的经济效益和产品质量。随着设备可靠性增强,其单一工厂设备故障数据越来越少,而工厂间出于隐私保护等原因无法共享数据。因此,如何在保护隐私的前提下,构建有效的联合训练模型变得十分重要。近年来,联邦学习逐渐引起研究者们的广泛关注。联邦学习可以保障隐私安全的前提下,在多参与方之间开展高效的机器学习。
[0003]随着联邦学习的发展,部分学者将联邦学习应用在工业领域中。文章[刘晶等.基于联邦增量学习的工业物联网数据共享方法[J].计算机应用,2022,42(04):1235

1243.]针对故障数据量不均衡以及新增量大的问题,提出一种基于联邦增量学习的数据共享方法。该方法加快了新增状态数据与原行业联合模型的融合,进一步提高了故障诊断率。文章[Geng D等.Bearing fault diagnosisbased on improved federated learning algorithm[J].Computing,2022,104(1):1

19.] 针对设备数据质量问题提出了一种用于轴承故障诊断的联邦学习算法 FA

FedAvg,加速训练模型收敛的同时,在不同类别和数据量下具有良好的鲁棒性。随着研究的深入,更多学者将注意力转向优化模型训练与提升通讯效率方面。
[0004]在优化模型训练方面,文章[杨云等.改进一维卷积神经网络与双向门控循环单元的轴承故障诊断研究[J/OL].机械科学与技术:1

8[2022

01

04].]提出改进的一维卷积神经网络与双向门控循环单元融合的新算法,有效学习信号中时间序列关系的同时进一步提升故障诊断率;文章[Cao Yudong等.Transfer learning forremaining useful life prediction of multi

conditions bearings based onbidirectional

GRU network[J].Measurement,2021,178.]提出了一种基于双向门控循环单元(TBiGRU)的传递学习方法,有效解决轴承退化轨迹不一致导致难以提取数据时序特征的问题,同时保证了数据的上下文完整性。上述研究虽然在保证数据完整性的同时进一步提取了隐性特征,但忽略了故障数据的强干扰性,导致特征提取不够充分,以及模型收敛速度较慢等问题。
[0005]在提升通讯效率方面,由于联邦学习中子端通常依靠慢速且不稳定的无线广域网络与中心服务器进行通信,通信开销时间往往会大于计算时间。针对这一问题,文章[SAHU A K等.Federatedoptimization for heterogeneous networks[J].arXivpreprint,2018,arXiv:1812.06127.]提出了一种更通用的FedProx算法,动态地更新不同客户端每一轮需要本地计算的次数,使得算法更适合非独立同分布(nonIID) 的联合建模场景;文章[CALDAS S等.Expanding the reach of federated learning byreducing client resource requirements[J].arXiv preprint,2018,arXiv:1812.07210.]优化了从服务器到参与方的模型参数传递,通过有损压缩以及联邦参数筛选的方式来减少从服务器到客户
端需要传递的参数数量从而降低通信成本。上述方法均在本地计算或在参数传递上降低了通信成本,但忽视了通讯效率与模型准确率间的关系以及故障数据异构性的影响,导致提升全局通讯效率遇到了瓶颈。

技术实现思路

[0006]本专利技术的目的在于提供一种基于动态联邦学习的设备故障诊断方法,该方法利用子端SAC

BIGRU故障诊断模型,充分提取各子端故障数据中的时序性和不平衡性特征,加快模型收敛速度的同时提升故障诊断精度。同时利用动态加权平衡算法(Fed

Dwb),动态调整模型上传参数比例与子端模型的训练次数,有效降低全局计算的参数量,充分利用各子端的资源使其快速收敛的同时提升通讯效率。
[0007]本专利技术所采取的技术方案是:
[0008]一种基于动态联邦学习的设备故障诊断方法,包括下述步骤:
[0009]S1:搭建包含局部更新模块与中心聚合模块的联邦学习框架;
[0010]S2:对深沟球轴承使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集正常状态、内圈故障、外圈故障和滚动体故障4种状态下的振动信号,得到多个数据点。所有工厂子端对故障数据进行采集、归一化等数据处理,按随机比例的故障数据设置各工厂子端的数据总量,同时以7:3的比例划分训练集与测试集;
[0011]S3:在局部更新模块中构造子端SAC

BIGRU故障诊断模型,由BIGRU层、注意力机制、跳跃连接、BN层、Dropout层、全连接层和softmax分类函数输出层构成。利用构造的故障诊断模型对处理后的数据进行训练并完成模型更新,随后初始化各子端的平衡系数(ω);
[0012]S4:在局部更新模块与中心聚合模块的通讯中,中心聚合模块利用动态加权平衡算法(Fed

Dwb),根据子端更新后的ω动态调整模型上传参数比例,动态调整送往中心端的参数总量;
[0013]S5:中心端对子端模型完成中心聚合,生成新一轮全局模型下发至工厂子端;
[0014]S6:在中心聚合模块与局部更新模块的通讯中,各子端接收中心端发送的全局模型,随后局部更新模块利用Fed

Dwb调整各子端ω,并根据子端的ω动态调整子端模型的训练次数,之后进入下一轮通讯。
[0015]进一步的,所述步骤S3中,局部更新模块中构造子端SAC

BIGRU故障诊断模型,完成模型更新后初始化各子端的ω,包括以下步骤:
[0016]1‑
1)在原跳跃连接上加入了注意力机制模块(Skip Attention Connection,简称SAC),即在跳跃连线上加入了权重计算,对数据特征进行权重提取。既保证数据特征提取的完整性,同时也使模型收敛速度更快。其中x
input
为模块的输入,为模块输入后的中间值,x
output
为模块的输出,F为映射函数,f为ReLU激活函数,σ、λ分别为跳跃连线和主通道上的权重,η为映射的系数,W,W
i
,W
s<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态联邦学习的设备故障诊断方法,其特征在于,包括下述步骤:S1:搭建包含局部更新模块与中心聚合模块的联邦学习框架;S2:对深沟球轴承使用电火花加工技术分别在轴承上对内圈、外圈和滚动体布置了3个故障等级的单点故障,选择电机驱动端振动传感器采集正常状态、内圈故障、外圈故障和滚动体故障4种状态下的振动信号,得到多个数据点。所有工厂子端对故障数据进行采集、归一化等数据处理,按随机比例的故障数据设置各工厂子端的数据总量,同时以7:3的比例划分训练集与测试集;S3:在局部更新模块中构造子端SAC

BIGRU故障诊断模型,由BIGRU层、注意力机制、跳跃连接、BN层、Dropout层、全连接层和softmax分类函数输出层构成。利用构造的故障诊断模型对处理后的数据进行训练并完成模型更新,随后初始化各子端的平衡系数ω;S4:在局部更新模块与中心聚合模块的通讯中,中心聚合模块利用动态加权平衡算法Fed

Dwb,根据子端更新后的ω动态调整模型上传参数比例,动态调整送往中心端的参数总量;S5:中心端对子端模型完成中心聚合,生成新一轮全局模型下发至工厂子端;S6:在中心聚合模块与局部更新模块的通讯中,各子端接收中心端发送的全局模型,随后局部更新模块利用Fed

Dwb调整各子端ω,并根据子端的ω动态调整子端模型的训练次数,之后进入下一轮通讯。2.根据权利要求1所述的一种基于动态联邦学习的设备故障诊断方法,其特征在于:所述步骤S3中,局部更新模块中构造子端SAC

BIGRU故障诊断模型,完成模型更新后初始化各子端的ω,包括以下步骤:1

1)在原跳跃连接上加入了注意力机制模块SAC,即在跳跃连线上加入了权重计算,对数据特征进行权重提取。既保证数据特征提取的完整性,同时也使模型收敛速度更快。其中x
input
为模块的输入,为模块输入后的中间值,x
output
为模块的输出,F为映射函数,f为ReLU激活函数,σ、λ分别为跳跃连线和主通道上的权重,η为映射的系数,W,W
i
,W
s
为矩阵。通过shortcut进行同等映射:F=W
i
η(W,x
input
)1

2)F(x)与x相加即为逐元素相加的过程:元素相加的过程:1

3)特征提取模块由两层BIGRU网络构成,调整BIGRU网络的记忆单元数目和神经网络的层数,实现对不同维度信号特征的充分提取;1

4)在第二个BIGRU层后加入改进后的CBAM模块,对主通道上的数据进行权重计算,有效提取数据的时序特征,并在BIGRU层外加入了融合改进CBAM模块的残差连接;1

5)通过对CBAM模块中的Channel Attention模块进行优化改进,进一步提升改进后的网络模型性能。选择一维全局平均池化代替用于处理图片分类任务的二维全局平局池化,用一维最大池化代替二维最大池化;
1

6)输入数据同时进行一维全局平均池化操作和最大池化操作得到两个标量,接着通过两层全连接神经网络,将从MaxPool与AvgPool提取的不同维度特征实现转换融合。将原先不同维度的特征转化为可叠加的特征进行拼接,得到新的特征池;1

7)通过Sigmoid激活函数得到权重系数,将权重系数和原来的特征相乘即可得到缩放后的新特征;1

8)初始化各工厂子端的ω,{ω1,ω2,


n
}

p。3.根据权利要...

【专利技术属性】
技术研发人员:刘晶赵益晨季海鹏盛译瑶张恒瑞
申请(专利权)人:河北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1