【技术实现步骤摘要】
一种基于深度强化学习的集群系统预防性维修方法
所属
[0001]本专利技术提供一种基于深度强化学习的集群系统预防性维修方法,尤其涉及一种考虑集群系统各组成单元的退化特征,基于深度强化学习算法,实现求解集群系统预防性维修问题的多单元集群维修决策方法,属于维修性工程领域。
技术介绍
[0002]预防性维修是指考虑产品退化状态,提前采取维修措施预防故障发生。目前基于状态的预防性维修正逐渐取代基于时间的预防性维修,集群系统由多个单一系统构成,具有高容错性,在军民领域得到广泛应用。近年来集群系统的预防性维修问题得到较大重视,但现有研究对集群组成系统和单元的大规模特征与退化状态特征,以及问题整体的非确定性多项式困难特征,考虑不充分。需要给出考虑集群各组成系统及单元退化状态的高效预防性维修方法
[0003]本专利技术基于深度神经网络预测模型和蒙特卡洛树搜索算法,专利技术了一种基于深度强化学习的新型预防性维修方法,解决了集群系统长期工作运行过程中的预防性维修问题。
技术实现思路
[0004]本专利技术的目的是为长期工作运行过程中的集群系统提供一种新型的预防性维修方法,旨在解决传统预防性维修方法未充分考虑集群系统各组成单元的大规模集群特征与退化状态特征,以及问题整体的非确定性多项式困难特征。
[0005]本专利技术提出了一种基于深度强化学习的预防性维修方法,该方法综合应用神经网络预测模型和蒙特卡洛树搜索算法生成预防性维修策略,主要包含以下步骤:
[0006]步骤一:集群系统退化状态描述。
...
【技术保护点】
【技术特征摘要】
1.基于深度强化学习的集群系统预防性维修方法,其特征在于:它包含以下步骤:第一步:集群系统退化状态描述:根据退化状态建立集群系统“单一系统
‑
单元”集群的剩余寿命状态矩阵。第二步:集群系统可靠性评估:基于集群系统“单一系统
‑
单元”集群剩余寿命状态,评估集群系统可靠性水平。第三步:基于深度神经网络的预防性维修策略预测:设计一个神经网络预测集群系统“单一系统
‑
单元”集群的先验维修概率和先验维修策略价值。第四步:基于蒙特卡洛树搜索算法的预防性维修策略搜索:构建预防性维修策略求解算法架构,遍历预防性维修策略解空间,选择一系列最佳维修动作。第五步:检验集群系统恢复程度:基于集群剩余寿命状态的变化计算集群系统可靠度,然后检验集群系统恢复程度。第六步:输出预防性维修策略:由预防性维修策略求解过程存储的一系列最佳维修动作生成一个完整的预防性策略。通过以上步骤,给出了一种基于深度强化学习的预防性维修方法,可以解决集群系统长期运行过程中进行“单一系统
‑
单元”集群的预防性维修问题。2.根据权利要求1所述的基于深度强化学习的集群系统预防性维修方法,其特征在于:在第一步中所述的“集群系统退化状态描述”中,基于集群系统“单一系统
‑
单元”集群剩余寿命状态,评估集群系统可靠性水平。将集群系统预防性维修策略视为多组成单元的集群维修决策问题展开研究。首先,考虑集群系统由M个单一系统组成,则该集群系统的单一系统集合可以表示为K={k1,k2,
…
,k
m
,
…
,k
M
};考虑各单一系统由N个单元组成,则其单元集合可以表示为U={u1,u2,
…
,u
n
,
…
,u
N
}。以此为基础,考虑各单元的剩余寿命(Remaining Useful Life,RUL),建立M
×
N的“单一系统
‑
单元”状态矩阵S
RUL
,其中矩阵元素表示单元u
(m,n)
在长期运行过程中的剩余寿命的退化状态。3.根据权利要求1所述的基于深度强化学习的集群系统预防性维修方法,其特征在于:在第二步中所述的“集群系统可靠性评估”中,基于集群系统“单一系统
‑
单元”集群剩余寿命状态,评估集群系统可靠性水平。定义R为全寿命周期的可靠度,当集群系统运行至时间τ时,单元u
(m,n)
的可靠度可以表示为R
mn
(τ),同时单一系统k
m
的可靠度可以表示为R
m
(τ),集群系统的“单一系统
‑
单元”的集群可靠度可以表示为R
fleet
(τ)。4.根据权利要求1所述的基于深度强化学习的集群系统预防性维修方法,其特征在于:在第三步中所述的“基于深度神经网络的预防性维修策略预测”中,设计一个深度残差网络(Residual Networks,ResNet)通过提取集群系统的集群剩余寿命特征,预测“单一系统
‑
单元”集群的先验维修概率矩阵p和先验集群预防性维修策略价值v。ResNet输入特征矩阵:即当前的“单一系统
...
【专利技术属性】
技术研发人员:冯强,吴其隆,任羿,王自力,孙博,杨德真,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。