一种基于联邦半监督学习的风机齿轮箱故障诊断方法技术

技术编号:37574055 阅读:16 留言:0更新日期:2023-05-15 07:51
本发明专利技术属于故障诊断领域,具体涉及一种基于联邦半监督学习的风机齿轮箱故障诊断方法,包括:在中心服务器使用标签样本训练全局模型,并下发给各客户端;各客户端使用本地的无标签数据集进行无监督训练;中心服务器收集各客户端模型参数,依据局部模型的可靠性进行参数的加权聚合;服务器和客户端之间交替进行有监督训练和无监督训练,直至全局模型满足训练精度。本发明专利技术在保护数据隐私的前提下,充分利用客户端的无标签数据,提高模型泛化能力,协同多个客户端实现模型共享,能够实现高精度的风机齿轮箱故障诊断。风机齿轮箱故障诊断。风机齿轮箱故障诊断。

【技术实现步骤摘要】
一种基于联邦半监督学习的风机齿轮箱故障诊断方法


[0001]本专利技术属于故障诊断领域,具体涉及一种基于联邦半监督学习的风机齿轮箱故障诊断方法。

技术介绍

[0002]随着传统能源带来的诸多环境问题和能源危机,风能作为一种可再生能源,因其清洁高效,分布广,储量大等优点受到关注与发展。在实际应用中,通过在野外布设风电机组将风能转换为电能是风能的主要用途。但是,随着使用时间的增加,大量风电机组遭受着各类故障的威胁,其中风电齿轮箱的故障是造成风电机组停机的主要原因,其故障的产生严重影响机组工作,会造成巨大的经济损失。因此,研究有效的风电齿轮箱故障诊断方法,快速而精准的诊断故障,有助于降低风电机组的运维成本,提高风电站的经济效益。
[0003]相比于传统的信号分析和机器学习,目前流行的故障诊断方法是数据驱动建模的深度学习方法。深度学习模型的训练很大程度上取决于用于训练有效模型的数据的质量。在实际场景中,由于以下几点原因,很难建立一个理想的数据集用于智能诊断模型的训练:首先在实际工程场景中,风机的齿轮箱通常处于正常工作状态,故障数据往往比正常数据少的多;其次故障数据的标注成本高昂,单一风电机组的大部分数据通常是无标签数据;最后对于大部分风电企业来说,由于竞争关系和数据保护,他们更倾向于数据隐私,并不希望共享数据。
[0004]综上所述,现有技术问题是:
[0005]在实际工程场景中,风机的齿轮箱通常处于正常工作状态,故障数据往往比正常数据少的多,导致故障数据的标注成本高昂,且单一风电机组的大部分数据通常是无标签数据;
[0006]对于大部分风电企业来说,由于竞争关系和数据保护,他们更倾向于数据隐私,并不希望共享数据;
[0007]在实际模型训练场景中,风电齿轮箱的故障分类任务需要行业内的专业知识储备,由于高昂的人工成本和海量数据的压力,绝大部分使用风电机组的企业并不会主动进行数据分类与处理。

技术实现思路

[0008]为解决上述技术问题,本专利技术提出一种基于联邦半监督学习的风机齿轮箱故障诊断方法,包括以下步骤:
[0009]S1:在风力发电机企业或者其他可信机构设立中心服务器,在单个风力发电场设立客户端,通过中心服务器中获取风机齿轮箱的故障数据的标签样本数据和通过客户端中获取风机齿轮箱的故障数据的无标签数据;
[0010]S2:将标签样本数据输入中心服务器初始化全局模型,并使用标签样本进行有监督训练,得到初步训练后的全局模型,并向每个客户端下发初步训练后的全局模型,客户端
通过共享初步训练后的全局模型的参数,得到局部模型;
[0011]S3:客户端对无标签数据集进行强弱扩增,使用窗口扭曲方法获得弱扩增样本,使用随机增强算法获得强扩增样本,对弱扩增样本在局部模型上的预测值进行阈值筛选作为伪标签;
[0012]S4:客户端使用伪标签与强扩增样本在局部模型上的预测结果计算交叉熵损失,同时使用中心服务器的有监督训练参数的正则项参与损失函数修正,指导局部模型进行无监督训练;
[0013]S5:在中心服务器中对所有局部模型的参数根据其可靠性进行模型参数的加权聚合;
[0014]S6:迭代执行S4和S5,直到服务器的模型达到训练精度,得到最终的共享故障诊断模型;
[0015]S7:通过共享故障诊断模型对风机齿轮箱进行实时故障诊断。
[0016]优选的,将标签样本数据输入中心服务器初始化全局模型,包括:
[0017]选用层次型结构神经网络模型作为全局模型,将交叉熵函数作为全局模型的损失函数,将标签样本数据输入全局模型进行有监督训练,通过损失函数计算模型训练中的预测值与真实值的误差损失,通过误差损失不断调整模型参数,直到损失最小时完成有监督训练,固定模型的参数,得到训练后的全局模型。
[0018]优选的,通过损失函数计算模型训练中的预测值与真实值的误差损失,包括:
[0019][0020]其中,θ
S
表示计算出的误差损失值,D
s
表示由N个有标签样本组成有标签数据集,y
i
表示样本x
i
对应的标签,η
s
表示选取的有监督学习参数,M
S
表示初始化的全局模型,Cross_Entropy()表示交叉熵函数。
[0021]优选的,对弱扩增样本在局部模型上的预测值进行阈值筛选作为伪标签,包括:
[0022][0023]其中,表示筛选出的伪标签,τ表示阈值超参数,1(
·
)表示one

hot化。
[0024]优选的,客户端使用伪标签与强扩增样本在局部模型上的预测结果计算交叉熵损失,包括:
[0025][0026]其中,表示计算出的交叉熵损失值,Du表示由k个客户端的本地无标签数据组成无标签数据集,组成无标签数据集,表示第K个客户端拥有N个强扩增样本和伪标签组成的实例,的实例,表示筛选出的伪标签,M
g
(A(x))表示局部模型对强扩增样本A(x)的预测值,Cross_Entropy( )表示交叉熵函数。
[0027]优选的,使用中心服务器的有监督训练参数的正则项参与损失函数修正,包括:
[0028][0029]其中,表示局部模型的损失函数,η
u
表示选取的无监督学习参数,φ

表示
上一轮学习所冻结的参数,η
L1
表示L1正则项所选择的参数,σ表示有监督学习参数集合,表示无监督参数集合,η
L2
表示L2正则项所选择的参数。
[0030]优选的,根据模型可靠性对所有局部模型的参数进行加权聚合,包括:
[0031][0032]其中,Γ(θ)表示本轮中心服务器加权聚合后的模型权重参数,表示编号为a的客户端局部模型在服务器验证集上的精确度,K
1:k
表示参与训练的1到k个客户端局部模型的集合,表示k个客户端的模型精度的集合。
[0033]本专利技术的有益效果:
[0034]通过建立联邦学习模型,实现数据的去中心化学习,保证数据的独立和隐私,同时采用半监督联邦学习算法,挖掘无标签数据的价值,提高模型的泛化能力;
[0035]将少部分有标签样本作为公共数据集放置于中心服务器,各风电企业作为只持有无标签数据集的客户端为背景,在保证数据隐私的前提下,协同多个风电机组建立一个共享的全局故障诊断模型,充分利用多个光伏电站的本地数据样本,建立联合故障诊断模型,能够实现高精度的风机齿轮箱故障诊断。
附图说明
[0036]图1为本专利技术的一种基于联邦半监督学习的风机齿轮箱故障诊断方法的流程图。
具体实施方式
[0037]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦半监督学习的风机齿轮箱故障诊断方法,其特征在于,包括:S1:在风力发电机企业或者其他可信机构设立中心服务器,在单个风力发电场设立客户端,通过中心服务器中获取风机齿轮箱的故障数据的标签样本数据和通过客户端中获取风机齿轮箱的故障数据的无标签数据;S2:将标签样本数据输入中心服务器初始化全局模型,并使用标签样本进行有监督训练,得到初步训练后的全局模型,并向每个客户端下发初步训练后的全局模型,客户端通过共享初步训练后的全局模型的参数,得到局部模型;S3:客户端对无标签数据集进行强弱扩增,使用窗口扭曲方法获得弱扩增样本,使用随机增强算法获得强扩增样本,对弱扩增样本在局部模型上的预测值进行阈值筛选作为伪标签;S4:客户端使用伪标签与强扩增样本在局部模型上的预测结果计算交叉熵损失,同时使用中心服务器的有监督训练参数的正则项参与损失函数修正,指导局部模型进行无监督训练;S5:在中心服务器中对所有局部模型的参数根据其可靠性进行模型参数的加权聚合;S6:迭代执行S4和S5,直到服务器的模型达到训练精度,得到最终的共享故障诊断模型;S7:通过共享故障诊断模型对风机齿轮箱进行实时故障诊断。2.根据权利要求1所述的一种基于联邦半监督学习的风机齿轮箱故障诊断方法,其特征在于,将标签样本数据输入中心服务器初始化全局模型,包括:选用层次型结构神经网络模型作为全局模型,将交叉熵函数作为全局模型的损失函数,将标签样本数据输入全局模型进行有监督训练,通过损失函数计算模型训练中的预测值与真实值的误差损失,通过误差损失不断调整模型参数,直到损失最小时完成有监督训练,固定模型的参数,得到训练后的全局模型。3.根据权利要求1所述的一种基于联邦半监督学习的风机齿轮箱故障诊断方法,其特征在于,通过损失函数计算模型训练中的预测值与真实值的误差损失,包括:其中,θ
S
表示计算出的误差损失值,D
s
表示由N个有标签样本组成有标签数据集,y
i
表示样本x
i

【专利技术属性】
技术研发人员:黄庆卿李丽韩延张焱王平魏旻王浩谢昊飞
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1