强化学习单元匹配循环神经网络系统及其训练和预测方法技术方案

技术编号：21116365 阅读：20 留言：0更新日期：2019-05-16 09:10

本发明专利技术涉及一种强化学习单元匹配循环神经网络系统及其训练和预测方法，包括循环神经网络、强化学习单元和单调趋势识别器，循环神经网络包括输入、输出和多个隐层，隐层包括多个隐层节点，单调趋势识别器判断由输入构建的时间序列的趋势状态，强化学习单元为根据输入时间序列的趋势状态，选择一个隐层层数和隐层节点数与其变化规律相适应的循环神经网络。本发明专利技术通过判断输入时间序列的趋势状态，用趋势状态和不同隐层层数及隐层节点数分别表示Q值集的状态与动作，根据更新后的Q值集来选择执行最优的动作，增强了RLUMRNN的泛化能力和收敛速度，本发明专利技术应用于旋转机械的剩余寿命预测的精度高。

全部详细技术资料下载

【技术实现步骤摘要】
强化学习单元匹配循环神经网络系统及其训练和预测方法
本专利技术涉及神经网络
，尤其涉及一种强化学习单元匹配循环神经网络系统及其训练和预测方法。
技术介绍
旋转机械是民用及国防领域的机械设备中应用最广泛的组件之一，在长期运行过程中旋转机械会逐渐退化，剩余寿命会逐步下降，故障的发生往往带来灾难性的事故，造成重大经济损失和严重的社会影响。对于旋转机械而言，经过设计和制造工艺的优化，设备的质量能够得到提高，但在服役过程中仍难以保证不出现故障。同类同型号的旋转机械设备即使在相同的工况下，由于运行环境各异、载荷作用复杂，其寿命数据具有较大的离散性，这给准确预测剩余寿命带来了困难。对于服役一段时间或到达设计寿命的旋转机械，盲目地维修或更换会造成不必要的资源浪费，剩余寿命评估可以为其维修决策的制定提供重要信息。目前工业企业对旋转机械的维护普遍采用视时维护制度，即无论设备是否发生故障，都对其进行定期检修，这样的检修制度虽然计划性强，但是时间和空间占用多，需要储备大量备品备件，消耗大批的资金，容易因检修周期间隔过长或过短造成旋转机械设备的欠维护或过维护。因此，有计划、有针对性地准确预测出旋转机械的剩余寿命,以便在旋转机械发生故障之前采取适当的措施以防止灾难性事故的发生，成为一个十分重要和紧迫的课题。当前，基于数据驱动的旋转机械剩余寿命预测方法获得越来越多的关注和研究。基于数据驱动的旋转机械剩余寿命预测方法可分为三类：第一类是现代模型预测方法，如粒子滤波(Particlefilter，PF)等；第二类是数值分析预测方法，如支持向量回归(SupportVectorRegre...

【技术保护点】
1.一种强化学习单元匹配循环神经网络系统，包括循环神经网络和强化学习单元，所述循环神经网络包括输入、输出和多个隐层，所述隐层包括多个隐层节点，其特征在于：还包括单调趋势识别器，所述单调趋势识别器判断由所述输入构建的时间序列的趋势状态，所述强化学习单元为根据输入时间序列的趋势状态，选择一个隐层层数和隐层节点数与其变化规律相适应的循环神经网络，其中，所述输入时间序列的趋势状态包括多个状态，每个趋势状态对应一个隐层层数和隐层节点数与其变化规律相适应的循环神经网络。

【技术特征摘要】
1.一种强化学习单元匹配循环神经网络系统，包括循环神经网络和强化学习单元，所述循环神经网络包括输入、输出和多个隐层，所述隐层包括多个隐层节点，其特征在于：还包括单调趋势识别器，所述单调趋势识别器判断由所述输入构建的时间序列的趋势状态，所述强化学习单元为根据输入时间序列的趋势状态，选择一个隐层层数和隐层节点数与其变化规律相适应的循环神经网络，其中，所述输入时间序列的趋势状态包括多个状态，每个趋势状态对应一个隐层层数和隐层节点数与其变化规律相适应的循环神经网络。2.如权利要求1所述的一种强化学习单元匹配循环神经网络系统，其特征在于：所述趋势状态包括上升趋势状态、下降趋势状态和平稳趋势状态。3.如权利要求2所述的一种强化学习单元匹配循环神经网络系统，其特征在于：所述单调趋势识别器将所述输入的时间序列xt＝[x1,x2,…,xt]T在时域坐标系中构建出相对应的点坐标(1,x1),(2,x2),…,(t,xt)，并将所述点坐标通过线性拟合，得出所述点坐标的线性拟合直线方程x＝ht+b，并求解出所述线性拟合方程的斜率h和截距b，则：1)若则为下降趋势状态；2)若则为上升趋势状态；3)若λ＜arctanh＜μ，则为平稳趋势状态；其中，λ是第一阈值，μ是第二阈值，λ＜0且μ＞0。4.如权利要求1所述的一种强化学习单元匹配循环神经网络系统，其特征在于：所述强化学习单元包括一个与隐层数和隐层节点数相对应的循环神经网络的的动作集、一个与所述趋势状态及其动作所对应的Q值集；所述强化学习单元根据所述输入时间序列的趋势状态，从动作集中选择一个动作，再根据所述Q值集，以及所述趋势状态下的最优策略得到所述趋势状态下的动作，通过所述趋势状态下的动作在动作集中所对应的隐层数和隐层节点数，得到所述趋势状态下的时间序列所对应的循环神经网络，并计算出所述循环神经网络的最终输出。5.一种强化学习单元匹配循环神经网络系统的训练方法，其特征...

【专利技术属性】
技术研发人员：李锋，陈勇，田大庆，
申请(专利权)人：四川大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人