基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法技术

技术编号:38233993 阅读:11 留言:0更新日期:2023-07-25 18:00
本发明专利技术公开了一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,涉及轴承故障智能诊断领域。方法包括如下步骤:高维空间域转换的视觉特征提取器构建;基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建;序列信号统计特征辅助下的语义矩阵构建;异常值插补的视觉

【技术实现步骤摘要】
基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法


[0001]本专利技术涉及轴承故障智能诊断领域,具体为一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。

技术介绍

[0002]在现代化的发展中,从风力发电、航空航天组件、矿山机械等大型制造业到小型企业的自动化制造设备,都离不开旋转机械设备的运用。为了满足不断发展的工业生产和制造业的需求,机械设备被设计得愈加精密、复杂与智能。但是,由于受运行环境、制作工艺等因素的影响,机械设备的故障率也逐渐攀升。
[0003]传统的故障诊断方法在诊断过程中,通常采用基于模型或基于信号处理的故障诊断方法。然而随着现代机械设备日益大型化、复杂化,前者往往难以建立能可靠反应机械系统工作特性的数值模型,后者因过于依赖人的技术经验,难以应对海量数据进行有效的故障特征提取。当前,数据驱动的智能故障诊断算法凭借强大的特征提取能力,逐渐代替了建立复杂的数值模型或繁琐的信号处理,成为国内外旋转机械故障诊断领域的研究热点。但是,现有数据驱动的智能故障诊断方法严重依赖于大量理想的标记数据,而实际工程场景下,尽管设备因长期运转积累了海量数据,却缺乏可用数据用以训练智能故障诊断模型,具体表现如下。
[0004](1)故障类型无历史训练数据问题,即零样本条件下的故障诊断。相较于实验室流程操作产生的典型故障类型,实际工程场景中,滚动轴承因载荷大、冲击强等恶劣工况,极易产生复杂多样的故障类型,导致没有任何已标记或未标记的历史训练数据可用于训练智能故障诊断模型。在不进行停机检查的情况下,利用已有的状态监测数据,如何识别无历史记录的故障类型(即未见类故障)、提高未见类故障识别的准确性,是现阶段故障诊断领域的关键问题,且亟需解决。
[0005](2)较主流的故障诊断模型结构普遍由人工设计方法进行选取,这在很大程度上依赖于设计者的经验知识,往往需要通过反复实验来确定最终的模型结构,很难权衡模型诊断速度和检测性能等多项指标,过程费时低效并且难以保证诊断模型泛化性。因此,如何在实现诊断模型性能自动均衡寻优的同时,给出拥有可信输出的最优模型组件结构尚需进行更加深入的研究。

技术实现思路

[0006]本专利技术为了进一步改善现有旋转机器故障诊断中固有的检测判别特征提取不充分、模型重构检测性能均衡效率低、各类样本数量不平衡、异常类/零样本识别受限等技术性瓶颈问题等问题,提出供一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法。
[0007]本专利技术是通过如下技术方案来实现的:一种基于深度模型高维参数多目标高效寻
优的零样本轴承故障诊断方法,包括如下步骤:
[0008]1)高维空间域转换的视觉特征提取器构建:
[0009]通常对轴承的故障诊断只是利用传感器采集到的振动信号进行分析,收集所得到的一维时域序列包含的故障特征信息不明显且特征之间相关性表达不充分。本专利技术围绕此类问题,利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器,首先利用传感器来收集多种状态下的序列信号,并将采集得到的数据映射入高维格拉姆角和场域(Gramain Angular Summation Field,GASF)中,在高维空间中以全连接层方式进行特征拆解,发掘数据样本高维空间维度上特征的可行性,搭配以卷积神经网络实现对数据样本视觉特征的高效提取;GASF变化表达函数如式(1)所示,构造视觉特征提取器的总体框架,如表1所示;
[0010][0011]式中为转换后的极坐标序列,I为单位行向量[1,1,

,1];具体转换过程即将时间序列在极坐标系统内进行编码,展现样本的不同信息粒度;在格拉姆矩阵中的每个元素是角度的三角函数值,利用三角函数的和运算则构建出格拉姆角和场域;
[0012]表1视觉特征提取器的总体框架
[0013][0014][0015]2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建:
[0016]本专利技术搭建出高维空间域转换的视觉特征提取器仅为大致框架,除最后一层全连接视觉特征提取层节点数确定以外,所涉及的内部诸多结构组件以及参数/超参数如何设定未知,仅利用人工经验方式对其操作将存在主观因素不合理且重新设计成本高的问题。因此,本专利技术构建出一种基于约束型Dropout神经网络的代理辅助进化算法(Constrained Dropout Neural Network based Surrogate

assisted Evolution Algorithm,CDNNEA)作为视觉特征提取器组件寻优策略,利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索,优化目标扩展为识别准确度、模型复杂度、训练时间三项维度,同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本,构建扩展性强的代理模型对搜索策略进行辅助,具体实现如下:
[0017]CDNNEA算法总体框架如图3所示,输入为:最大评价次数MaxFE,评价次数FE,种群大小P,决策变量维度d,代价函数f,真实评价解的数量σ,评判比率ρ,输出为真实问题的非支配解集(X,Y),具体包括如下步骤:
[0018]①
生成初始解部分:X=LatinHypercubeSample(11d

1),Y=f(X);
[0019]②
FE=11d

1;
[0020]③
开始算法迭代:WHILE FE≤MaxFE DO;
[0021]④
利用训练数据集训练代理模型:C

dropout=TrainingData(X,Y);
[0022]⑤
对种群中的非支配解集进行优化搜索:(X1,Y1,ρ1,ρ2)=Estimate(P,C

dropout);
[0023]⑥
根据管理准则选择σ个先前所得非支配解进行真实评估:
[0024]X2=Selection(X1,Y1,ρ1,ρ2,C

dropout,σ),Y2=f(X2);
[0025]⑦
X'=X∪X2,Y'=Y∪Y2;
[0026]⑧
对训练数据集进行更新:(X,Y)=Update(X',Y',11d

1,σ);
[0027]⑨
FE=FE+1,ρ1=ρ2;
[0028]⑩
END WHILE;
[0029]其中,步骤

为生成初始解部分,用来采样经过真实计算后的部分初始样本,并基于此生成初始训练数据集。步骤

到步骤

为算法的主要迭代过程,步骤

主要利用训练数据集训练代理模型;步骤

则对种群中的非支配解集进行优化搜索,期间所涉及到的目标评估无需进行代价昂贵的真实计算,仅依赖计算低廉的代理模型便可实现;最后,由于最初本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:包括如下步骤:1)高维空间域转换的视觉特征提取器构建:利用卷积神经网络深度模型构建出高维空间域转换的视觉特征提取器,首先利用传感器来收集多种状态下的序列信号,并将采集得到的数据映射入高维格拉姆角和场域GASF中,在高维空间中以全连接层方式进行特征拆解,发掘数据样本高维空间维度上特征的可行性,搭配以卷积神经网络实现对数据样本视觉特征的高效提取;GASF变化表达函数如式(1)所示,构造视觉特征提取器的总体框架;式中为转换后的极坐标序列,I为单位行向量[1,1,

,1];具体转换过程即将时间序列在极坐标系统内进行编码,展现样本的不同信息粒度;在格拉姆矩阵中的每个元素是角度的三角函数值,利用三角函数的和运算则构建出格拉姆角和场域;2)基于代理辅助多目标进化算法的视觉特征提取器组件寻优策略构建:构建出一种基于约束型Dropout神经网络的代理辅助进化算法CDNNEA作为视觉特征提取器组件寻优策略,利用该寻优策略对进行视觉特征提取的深度模型内部组件进行自适应搜索,优化目标扩展为识别准确度、模型复杂度、训练时间三项维度,同时为了降低单目标寻优过程中模型训练和评估过程中的时间成本和硬件成本,构建扩展性强的代理模型对搜索策略进行辅助,具体实现如下:CDNNEA算法总体框架,输入为:最大评价次数MaxFE,评价次数FE,种群大小P,决策变量维度d,代价函数f,真实评价解的数量σ,评判比率ρ,输出为真实问题的非支配解集(X,Y),具体包括如下步骤:

生成初始解部分:X=LatinHypercubeSample(11d

1),Y=f(X);

FE=11d

1;

开始算法迭代:WHILE FE≤MaxFE DO;

利用训练数据集训练代理模型:C

dropout=TrainingData(X,Y);

对种群中的非支配解集进行优化搜索:(X1,Y1,ρ1,ρ2)=Estimate(P,C

dropout);

根据管理准则选择σ个先前所得非支配解进行真实评估:X2=Selection(X1,Y1,ρ1,ρ2,C

dropout,σ),Y2=f(X2);

X'=X∪X2,Y'=Y∪Y2;

对训练数据集进行更新:(X,Y)=Update(X',Y',11d

1,σ);

FE=FE+1,ρ1=ρ2;

END WHILE;3)序列信号统计特征辅助下的语义矩阵构建:符合缺陷信号本质且适量的特征量对缺陷识别有重要的影响,为了能找到同时满足体现故障信号本质且数量最优的语义向量,选择均方根值、方根幅值、绝对平均幅值、标准差、最大值、最小值、峰峰值、峭度、峰态、偏度、八阶矩系数、十六阶矩系数、波形指标、峰值指标、脉冲指标、裕度指标、峭度指标、偏态指标、均方频谱、频谱重心、频域方差、相关因子、谐
波因子、谱原点矩,这24种时域或频域特征作为轴承故障的统计特征语义表征模型;4)异常值插补的视觉

语义自编码零样本映射策略构建:在映射层添加具体语义信息的限制,约束重建效果,实现有监督下的投影函数学习,以语义属性描述或词向量作为迁移知识,将隐藏层的信息设定为样本语义属性,利用自动编码器将视觉特征映射到语义空间中,并利用解码器重构原始的视觉特征。2.根据权利要求1所述的一种基于深度模型高维参数多目标高效寻优的零样本轴承故障诊断方法,其特征在于:步骤2)的步骤

中,利用训练数据集训练代理模型,使用的一种约束型Dropout神经网络可扩展代理模型,以缩减不同子模型输出间分布的差异性为出发点,新增样本填充机制以及损失约束项来提升多目标问题求解过程中代理模型的可信度,对于批次大小为d的样本组成的训练集T={(X
i
,Y
i
)}(i=1,2,...,d),d与决策变量大小一致,原始进行反向传播的目的即最小化式(2)所示的均方误差函数;在C

dropout过程中,每个批次的训练数据X
i
都将被复制后堆叠为新样本再输入,其目的在于模拟相同数据的两次正向传播过程以获取模型预测结果的两个分布P1=P(X
i
|Y
i
)与P2=P'(X'
i
|Y'
i
),同时凭借Dropout网络结构动态变化的特性,堆叠新样本的方式可对昂贵优化问题中稀缺的真实计算样本进行一定程度上的数据扩充;此时误差损失最小化的目标则变化为式(3),且对子模型差异性的缩减问题便转化为如何对输出后的分布P1与P2进行约束;结合斯皮尔曼相关系数对变量间相关程度的有效度量,将其应用于衡量两次输出的不一致性,即构造式(4)所示的约束项,并与l2联立成最终的训练损失函数如式(5)所示,以此降低原始网络空间中参数的自由度;求取误差后,模型将按照所设迭代次数,结合由梯度与链式法更新后的权值和偏差进行反向传播,最终完成训练阶段;最终完成训练阶段;最终完成训练阶段;最终完成训练阶段...

【专利技术属性】
技术研发人员:张睿白晓露张永梅潘理虎胡立华谢斌红
申请(专利权)人:太原科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1