【技术实现步骤摘要】
复杂装备智能维护方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种复杂装备智能维护方法
、
装置
、
电子设备及存储介质
。
技术介绍
[0002]随着科学技术的快速发展,现代社会的不断推进越来越离不开各类复杂装备,其中,复杂装备是指装备组成关系复杂
、
行为复杂
、
系统的子系统间以及系统与其环境之间交互关系复杂和能量交换复杂的装备,在实际应用中,一旦发生装备失效情况,轻则影响生产效率,重则很有可能导致人员伤亡,因此,在复杂装备的使用过程中,合理安排装备全寿命阶段的维护策略,提高装备的可靠性非常有必要
。
[0003]对于复杂装备的维护策略,现有的维修方式主要以预防性的定期维修为主,即按照设备的使用寿命
、
时间或固定周期制定维修计划,但实际上,复杂设备的故障和寿命与时间并不一定直接相关,因此,采用定期维修方式可能会出现维修不足或维修过剩情况,同时极有可能出现难以预防的与时间无关的故障等问题,而随着基于环境状态的视情维修发展,人们亟需一种智能化的维修决策工具
。
[0004]人工神经网络,特别是基于深度学习的方法,被广泛应用于装备的智能维护
。
虽然这些方法在一定程度上可以解决装备智能维护问题,但上述方法在装备智能维护中的应用仍存在两个不足之处:第一,无法直接建立原始数据与维护决策之间的映射;第二,神经网络参数的优化需要大量人工修改以及专家经验 ...
【技术保护点】
【技术特征摘要】
1.
一种复杂装备智能维护方法,其特征在于,应用于基于多尺度残差
Q
网络的智能维护系统,所述智能维护系统包括决策环境
、
决策智能体,所述方法包括:获取待测复杂装备的全生命周期数据;将所述全生命周期数据输入至所述决策环境先进行标签化处理,再随机打乱,输出待测环境状态至所述决策智能体,所述决策智能体对应最优维护策略;根据所述最优维护策略,结合所述决策智能体以及所述决策环境对所述待测环境状态进行多尺度残差特征提取处理,输出所述待测环境状态对应的最优维护动作,所述最优维护动作用于对所述待测复杂装备进行维护
。2.
根据权利要求1所述的复杂装备智能维护方法,其特征在于,所述将所述全生命周期数据输入至所述决策环境先进行标签化处理,再随机打乱,输出待测环境状态至所述决策智能体,包括:将所述全生命周期数据输入至所述决策环境,通过标签化处理提取所述全生命周期数据的环境状态数据,再对所述环境状态数据进行随机打乱处理,获得初始环境状态;按时间先后顺序排列所述初始环境状态,获得待测环境状态,并输出所述待测环境状态至所述决策智能体
。3.
根据权利要求1所述的复杂装备智能维护方法,其特征在于,所述决策智能体包括基于多尺度残差
Q
网络的评估网络模型以及目标网络模型,所述待测环境状态包括当前环境状态以及下一时刻环境状态,所述最优维护策略表征带有模型参数的决策智能体,所述根据所述最优维护策略,结合所述决策智能体以及所述决策环境对所述待测环境状态进行多尺度残差特征提取处理,输出所述待测环境状态对应的最优维护动作,包括:步骤
S01
:将所述当前环境状态输入至所述评估网络模型进行多层次残差特征提取,输出评估状态函数,所述评估状态函数对应当前预测维护动作;步骤
S02
:将所述下一时刻环境状态输入至所述目标网络模型进行多层次残差特征提取,输出目标状态函数,所述评估状态函数对应下一时刻预测维护动作;步骤
S03
:根据所述最优维护策略,列出所述决策环境执行所述当前预测维护动作的执行概率,通过所述决策环境结合所述执行概率以及预设奖励策略计算环境评估奖励,并将所述环境评估奖励反馈回所述决策智能体;步骤
S04
:列出所述评估状态函数对应的带参评估状态函数,所述带参评估状态函数对应第一网络参数;步骤
S05
:列出所述目标状态函数对应的带参目标状态函数,所述带参目标状态函数对应第二网络参数;步骤
S06
:根据所述带参评估状态函数
、
所述带参目标状态函数以及所述环境评估奖励,列出状态损失函数;步骤
S07
:根据所述状态损失函数对所述第一网络参数进行随机梯度下降求解,并根据求解结果对所述第一网络参数进行参数更新,根据异步更新策略,采用更新后的第一网络参数对所述第二网络参数进行参数更新;步骤
S08
:基于对第一网络参数以及第二网络参数的更新,更新所述最优维护策略对应的模型参数;步骤
S09
:重复执行步骤
S03
至
S08
,直至所述决策环境与所述决策智能体之间达到最大
交互步数,使得更新后的模型参数达到最优解,通过所述决策智能体输出最优维护动作
。4.
根据权利要求3所述的复杂装备智能维护方法,其特征在于,所述多尺度残差
Q
网络包括多尺度残差网络,所述多尺度残差网络包括级联多尺度残差块,多层次特征融合模块以及全连接层,则在所述评估网络模型或所述目标网络模型中进行多层次残差特征提取的处理步骤,包括:对所述多尺度残差网络的输入特征进行特征提取,获得浅层特征,并将所述浅层特征输入至所述级联多尺度残差块进行深层特征提取,获得多个不同层次的深层特征;通过所述多层次特征融合模块对所述多个不同层次的深层特征进行自适应特征提取融合,输出多层次融合特征;采用长跳跃特征融合方式将所述浅层特征与所述多层次融合特征进行特征融合,输出融合特征图;将所述融合特征图输入至所述全连接层进行全连接操作,获得每类维护动作的状态函数
。5.
根据权利要求4所述的复杂装备智能维护方法,其特征在于,所述级联多尺度残差块包括若干个以串联方式连接的多尺度残差块,所述将所述浅层特征输入至所述级联多尺度残差块进行深层特征提取,获得多个不同层次的深层特征,包括:步骤
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。