面向旋转机械故障诊断的分层多叉网络结构高效搜索方法技术

技术编号:29049147 阅读:27 留言:0更新日期:2021-06-26 06:09
本发明专利技术公开了一种面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,利用长短时记忆网络创建控制器来搜索确定两类元结构,再按照定义堆叠成子模型。元结构由五个节点构成,包括两个输入节点和三个待搜索节点,待搜索节点又包括左右子节点,子节点的输入和操作类型待搜索确定。子模型由元结构堆叠的分层结构能控制搜索自由度提升搜索效率,并且支撑子模型的迁移性能;元结构中节点的多叉结构相比于链式结构又使得子模型能从原始数据中提取更深层的特征,对于提升其诊断性能有重要意义。方法使用时,以元结构待搜索量为输入、由子模型验证精度确定的标签为输出训练控制器,控制器设计出两类元结构根据堆叠定义和规则创建出完整的子模型,在目标数据集上进行验证,控制器和子模型的训练交替进行,最终得到能够设计出有着良好诊断性能和迁移性能的子模型的控制器。以上特点使得本发明专利技术方法在面对不同的旋转机械诊断任务时可以自动创建高精度的诊断模型,并且能够迁移完成其它的诊断任务。并且能够迁移完成其它的诊断任务。并且能够迁移完成其它的诊断任务。

【技术实现步骤摘要】
面向旋转机械故障诊断的分层多叉网络结构高效搜索方法


[0001]本专利技术属于旋转机械故障诊断网络结构自动搜索方法
,具体涉及面向旋转机械故障诊断的分层多叉网络结构高效搜索方法。

技术介绍

[0002]旋转机械组件如轴承、齿轮、滚珠丝杠等作为传动部件的核心组成部分应用非常广泛,重要性也日益突出。近年来,关于旋转机械健康管理的研究也越来越成熟,特别是旋转机械的故障诊断方法,从开始的经典方法,发展到现在以数据驱动方法为主,就是因为数据驱动的方法特别是深度学习的方法能自动提取数据特征,应用快速便捷,对专业知识要求较低。不过在面对不同的旋转部件对象时需要重新训练,甚至需要重新设计创建神经网络。根据具体问题设计特定的神经网络模型能取得非常高的诊断精度,缺点是网络结构复杂,涉及到很多信号处理及深度学习建模相关的知识,需要高昂的时间和人力成本。
[0003]为了解决这个问题,研究者们进行了两个方向的探索,1)迁移学习,提高网络模型的迁移性能,将针对某一特定诊断任务的网络模型迁移至其它诊断任务;2)神经结构搜索,面对具体的诊断任务可自动设计出高性能的网络模型,摆脱对建模知识的依赖。
[0004]迁移学习当前的局限是只能在同类相似甚至相同设备之间进行方法模型的迁移,其中完全迁移在诊断精度上差强人意,特别在不同设备之间的迁移诊断上,而且模型的改造需要专门知识支撑;而半迁移虽然能够重用基于源域数据训练的模型结构和权值,一定程度上节省创建新模型的时间人力成本,但当面对多种目标域诊断任务时,源域模型并不都能很好地完成迁移,仍然需要创建新的模型。
[0005]神经结构搜索的逻辑过程是首先定义搜索空间,然后通过搜索策略找出候选网络结构,对这些候选网络进行评估,再根据反馈进行下一轮搜索。相对于迁移诊断,神经结构搜索的研究不多,旋转机械的诊断网络自动搜索则更少,西工大作者基于强化学习创建了卷积神经网络结构搜索方法,能根据当前状态设计选择网络层创建子模型,经过验证搜索出的子模型能达到不错的精度。
[0006]神经结构自动搜索方法虽然能自动地针对不同的诊断任务设计不同的神经网络模型,但是搜索效率低、消耗计算资源多是阻碍其发展的最大的问题。因此,在图像识别领域国外研究者CMU和Google又提出了基于块的网络生成方法,通过搜索定制化的块堆叠成子模型来控制搜索自由度。谷歌的学者也提出了重用子模型网络层权重的方法来提升搜索效率。以及哥伦比亚大学学者提出结合网络结构信息,超参数信息以及时序验证精度信息预测模型表现,以指导网络结构搜索的方法来节省子模型验证时间。不过这些策略和方法仍然存在降低模型性能或者对模型的评价具备不确定性等一系列问题。

技术实现思路

[0007]针对现有技术方法存在的不足,本专利技术的目的在于提供一种面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,该方法解决了针对不同诊断任务重新设计高精度诊
断模型依赖建模专业知识、神经结构自动搜索方法消耗大量计算资源以及针对具体问题搜索出的网络模型无法适用其它诊断任务的问题。
[0008]为实现上述目的,本专利技术一种面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,具体包括以下步骤:
[0009]S1、基于长短时记忆网络搭建控制器,根据元结构待搜索量做出决策,从输入节点空间和操作空间中搜索创建两类元结构正常元和降维元;
[0010]S2、按照堆叠定义和堆叠规则将两类元结构堆叠成子模型,利用划分的训练数据和测试数据训练并验证子模型;
[0011]S3、取子模型验证精度,按照控制器优化逻辑得到相应损失,训练控制器优化其参数,使得其能搜索出高精度的子模型;
[0012]S4、子模型和控制器交替训练,最终得到能搜索出良好诊断性能和迁移性能子模型的控制器,将其搜索出的子模型迁移至其它目标数据,实现迁移诊断。
[0013]进一步,所述步骤S1中的元结构包括两个输入节点,节点1和节点2以及三个待搜索节点,节点3、节点4和节点5。
[0014]所述五个节点其特征在于,当前节点只能以前面节点的输出作为输入,节点之间可连线成有向无环图;
[0015]所述输入节点无结构,为输入数据的连接节点,所述待搜索节点包括两个子节点,子节点的输入和操作类型由控制器搜索决策,左右子节点的输出相加为节点的输出。
[0016]进一步,所述步骤S1中的输入节点空间维度是递增的,对于不同的节点,由于其只能以前面节点的输出作为输入,因此其可选输入节点的数量递增。
[0017]进一步,所述步骤S1中的操作空间有四种可选操作;
[0018]所述操作空间可选操作类型包括核尺寸为17的卷积层、核尺寸为21的卷积层、核尺寸为2的最大池化层和核尺寸为2的平均池化层,其它参数如滑动步数和卷积层的核数待定。
[0019]进一步,所述步骤S1中的两类元结构包括正常元和降维元,正常元中的操作类型的滑动步数均为1,降维元中的操作类型的滑动步数均为2。
[0020]进一步,所述步骤S1中基于长短时记忆网络搭建的控制器包含12维输出;
[0021]所述12维输出的前中后四维分别对应元结构中的三个待搜索节点,每四维输出对应决策待搜索节点的左子节点的输入、右子节点的输入、左子节点的操作类型和右子节点的操作类型。对应于输入空间维度和操作空间维度,决策不同节点输入的输出深度递增,决策不同节点操作的输出深度不变为4。
[0022]进一步,所述步骤S1具体为:
[0023]S11、利用长短时记忆网络,根据元结构内部节点结构搭建控制器;
[0024]S12、根据正常元结构确定待搜索量输入至正常元控制器,通过长短时记忆网络计算,得到12维输出;
[0025]S13、根据控制器决策输出,从输入空间中确定各子节点的输入节点,得到元结构的数据流图,再从操作空间中确定各子节点操作类型,得到完整的正常元结构;
[0026]S14、同样地,通过降维元控制器得到完整的降维元结构。
[0027]进一步,所述步骤S2中的堆叠定义即为两类元结构的堆叠顺序和连接关系;
[0028]所述堆叠顺序为N

R

R,即正常元叠加降维元,再叠加降维元;
[0029]所述连接关系为第i个元结构的node0与第i

2个元结构的输出连接,node1与第i

1个元结构的输出连接,当元结构的序号小于1时,其输出即为子模型的初始输入。
[0030]进一步,所述步骤S2中的堆叠规则包括四项内容;
[0031]所述四项堆叠规则为:1)设定了一个全局变量cf,随着降维元个数增多而加倍,在搜索操作类型时,保证操作层输出张量的深度与cf相同;2)节点的左右子节点输出相加时,要确保两个输出的尺寸相同;3)当元结构中只有一个节点的输出空闲时,其即为元结构输出,当有多个节点输出空闲时,其连接结果为元结构输出;4)元结构堆叠完成之后,连接输出块,构成完整的子模型。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,包括以下步骤:S1、基于长短时记忆网络搭建控制器,根据元结构待搜索量做出决策,从输入节点空间和操作空间中搜索创建两类元结构正常元和降维元;S2、按照堆叠定义和堆叠规则将两类元结构堆叠成子模型,利用划分的训练数据和测试数据训练并验证子模型;S3、取子模型验证精度,按照控制器优化逻辑得到相应损失,训练控制器优化其参数,使得其能搜索出高精度的子模型;S4、子模型和控制器交替训练,最终得到能搜索出良好诊断性能和迁移性能子模型的控制器,将其搜索出的子模型迁移至其它目标数据,实现迁移诊断。2.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,所述步骤S1中的元结构包括两个输入节点,节点1和节点2以及三个待搜索节点,节点3、节点4和节点5。所述五个节点其特征在于,当前节点只能以前面节点的输出作为输入,节点之间可连线成有向无环图;所述输入节点无结构,为输入数据的连接节点,所述待搜索节点包括两个子节点,子节点的输入和操作类型由控制器搜索决策,左右子节点的输出相加为节点的输出。3.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,所述步骤S1中的输入节点空间维度是递增的,对于不同的节点,由于其只能以前面节点的输出作为输入,因此其可选输入节点的数量递增。4.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于所述步骤S1中的操作空间有四种可选操作;所述操作空间可选操作类型包括核尺寸为17的卷积层、核尺寸为21的卷积层、核尺寸为2的最大池化层和核尺寸为2的平均池化层,其它参数如滑动步数和卷积层的核数待定。5.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于所述步骤S1中的两类元结构包括正常元和降维元,正常元中的操作类型的滑动步数均为1,降维元中的操作类型的滑动步数均为2。6.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于所述步骤S1中基于长短时记忆网络搭建的控制器包含12维输出;所述12维输出的前中后四维分别对应元结构中的三个待搜索节点,每四维输出对应决策待搜索节点的左子节点的输入、右子节点的输入、左子节点的操作类型和右子节点的操作类型。对应于输入空间维度和操作空间维度,决策不同节点输入的输出深度递增,决策不同节点操作的输出深度不变为4。7.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,所述步骤S1具体为:S11、利用长短时记忆网络,根据元结构内部节点结构搭建控制器;S12、根据正常元结构确定待搜索量输入至正常元控制器,通过长短时记忆网络计算,得到12维输出;S13、根据控制器决策输出,从输入空间中确定各子节点的输入节点,得到元结构的数
据流图,再从操作空间中确定各子节点操作类型,得到完整的正常元结构;S14、同样地,通过降维元控制器得到完整的降维元结构。8.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,所述步骤S2中的堆叠定义即为两类元结构的堆叠顺序和连接关系;所述堆叠顺序为N

R

R,即正常元叠加降维元,再叠加降维元;所述连接关系为第i个元结构的node0与第i

2个元结构的输出连接,node1 与第i

1个元结构的输出连接,当元结构的序号小于1时,其输出即为子模型的初始输入。9.如权利要求1所述的面向旋转机械故障诊断的分层多叉网络结构高效搜索方法,其特征在于,所述步骤S2中的堆叠规则包括四项内容;所述四项规则为:1)设定了一...

【专利技术属性】
技术研发人员:王艺玮周健郑联语
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1