当前位置: 首页 > 专利查询>武汉大学专利>正文

基于强化学习的船舶运动大多步实时预测混合方法及系统技术方案

技术编号:33553633 阅读:11 留言:0更新日期:2022-05-26 22:50
本发明专利技术提供一种基于强化学习的船舶运动大多步实时预测混合方法及系统,包括由船舶上安装的姿态传感器获取原始船舶运动数据,划分为训练数据集和预测数据集,进行实时小波包分解RTWPD,将船舶运动数据的高频分量和低频分量分解为固定层数的子序列;对分解得到的每个子序列建立ORELM基础预测模型,并引入AdaBoost.MRT强化学习方式,不断迭代训练,将多个训练好的ORELM模型组合在一起;最后将子序列的预测结果重构得到模型大多步初始预测结果,对大多步预测误差建立LSSVM误差修正模型,进一步提取包含在大多步误差序列中少部分船舶运动数据的变化规律,修正得到最终的船舶运动大多步预测结果并输出。本发明专利技术提高了船舶运动姿态大多步预测的稳定性与准确性。运动姿态大多步预测的稳定性与准确性。运动姿态大多步预测的稳定性与准确性。

【技术实现步骤摘要】
基于强化学习的船舶运动大多步实时预测混合方法及系统


[0001]本专利技术涉及船舶运动姿态预测方法,尤其涉及一种基于实时分解、强化学习和误差修正的船舶姿态大多步预测方案。

技术介绍

[0002]船舶在海上作业过程中,会产生横摇、横荡、纵摇、纵荡、升沉、艏摇六自由度运动,其中,横摇、纵摇对海上作业安全与船舶运行性能的影响最大。如果能够提前10~30秒预测船舶横摇、纵摇的变化,相应的船员和船舶作业系统就能提前做出合理的决策,提高船舶在海上航行的稳定性和可靠性,同时提高海上作业的安全性和工作效率。不仅如此,实时的船舶姿态预测模型可以为获取摇晃信息提供可靠的指导,从而更大程度地减小横摇、纵摇对船舶造成的负面影响。因此,建立准确的船舶姿态大多步实时预测模型具有重要意义。
[0003]为了实现船舶姿态多步实时预测模型,许多学者进行了大量的研究。随着计算机时代的到来,神经网络能够较好的拟合船舶姿态的非线性映射,在船舶姿态多步实时预测中有良好的表现。由于船舶姿态数据映射关系的复杂性,短期实时预测(10~30秒)比极短期实时预测(10秒以内)更加困难和复杂。单一模型预测性能略显不足。为了更好的实时预测大多步船舶姿态,结合分解技术、集成技术等的混合模型得到了广泛的应用。其中,强预测器比基本预测器更能学习到时间序列的非显著相关性。由于船舶姿态具有不平稳、波动大和高随机等特性,导致预测模型很难完整的学习船舶姿态变化规律,少部分规律信息隐含在预测误差中,所以误差修正模型也被广泛应用于大多步时间序列混合预测模型中。因此,本专利技术希望能够提高神经网络模型的预测能力,实现对船舶运动数据高精度的大多步实时预测。

技术实现思路

[0004]本专利技术的目的是针对目前船舶运动姿态预测精度较低的问题,提供一种基于实时分解、强化学习和误差修正的船舶姿态大多步预测方案。
[0005]本专利技术提供的一种基于强化学习的船舶运动大多步实时预测混合方法,包括如下步骤:
[0006]与现有技术相比,本专利技术具有以下优点和有益效果:
[0007]1.对训练数据集和预测数据集分别进行WPD实时分解,将船舶运动数据高低频分量分解为固定层数的子序列,提升了模型学习子序列变化规律和船舶姿态的映射关系的能力;
[0008]2.建立多输入多输出策略的ORELM基础预测模型,避免了多步预测的误差累计。并引入AdaBoost.MRT算法,克服了ORELM模型预测结果不稳定的问题,同时增强了单个ORELM在大多步预测中对船舶姿态序列的学习能力;
[0009]3.对大多步预测误差建立LSSVM误差修正模型,误差修正模型能够进一步提取包含在大多步误差序列中少部分船舶运动数据的变化规律,实现对船舶运动数据更加完整的
学习和大多步预测。
附图说明
[0010]图1是本专利技术实施例所提预测模型完整结构图。
具体实施方式
[0011]下面将结合实施例和附图,对本专利技术的技术方案进行清楚、完整地描述。
[0012]参见图1,本专利技术实施例基于实时分解、强化学习和误差修正,提供的船舶姿态大多步预测方法的步骤如下:
[0013]步骤1:由船舶上安装的姿态传感器获取原始船舶运动数据,将原始船舶运动数据划分为训练数据集和预测数据集;
[0014]数据集的70%作为训练集,用于训练初始ORELM模型以及AdaBoost.MRT算法强化ORELM;30%作为预测集,预测数据集再划分为验证集和测试集,验证集和测试集各占15%,验证集预测误差用于建立误差修正模型;测试集用于验证所提模型的预测性能。实施例中数据集总长度为1800秒。
[0015]步骤2:单独对步骤1)划分好的训练数据集和预测数据集进行实时小波包分解(RTWPD),将船舶运动数据的高频分量和低频分量分解为固定层数的子序列,优选地,所述高频分量子序列固定层数为4,低频分量子序列固定层数为4;这样,其中低频分量的每个子序列的波动性更小,高频分量变化规律之间的映射关系更易被后续强化后的模型学习;
[0016]本专利技术提出的实时小波包分解(RTWPD)方法,是在现有小波包分解(WPD)技术基础上的改进:首先对原始数据进行划分数据集,所述划分过程包括训练集,验证集,测试集;其中,对训练集进行小波包分解(WPD);而当姿态传感器获取新数据时,即为验证集,再对验证集进行小波包分解,分解后的子序列送入训练完成的各预测模型;重复上述操作,即可完成实时小波包分解(RTWPD)。
[0017]实施例中,实时小波包分解RTWPD的分解步骤如下:
[0018]Step 1:设置分解等级设置为3,小波基函数选择db10;构建23个小波包子空间,并构造对应的高通滤波器组和低通滤波器组,具体表示如下:
[0019][0020]其中,h(k)和g(k)分别为平移参数为k的高通滤波器组和低通滤波器组,k为平移参数;表示t时刻的尺度函数,θ(t)表示t时刻的小波变换函数,表示和的内积运算,<θ(t),θ(2t

k)>表示θ(t)和θ(2t

k)的内积运算。
[0021]Step 2:RTWPD将船舶运动序列训练部分S(t)映射到上述子空间中,得到子序列S(3,0)、S(3,1)、S(3,2)、S(3,3)、S(3,4)、S(3,5)、S(3,6)、S(3,7),每个子序列的长度都为1260秒,具体分解算法如下:
[0022][0023]其中,i为分解层,i∈{3,2,1,0};j为频率参数,j∈{6,4,2,0},W
k
(i,j)表示在第i个分解层,第j个分解频带,平移参数为k的小波系数;
[0024]Step 3:获取新的数据,更新训练部分S(t),重复Step 1

2,直到1800秒的数据全部获得。
[0025]现有一次分解技术,包括WPD,在实际情况中无法获取未来数据,存在数据泄漏,而本专利技术提出的实时小波包分解可不断更新未来数据,训练时仅使用已知数据,符合船舶预测实际应用。
[0026]步骤3:对步骤2)分解得到的每个子序列建立离群点鲁棒极限学习机(ORELM)基础预测模型,并引入AdaBoost.MRT强化学习算法,通过不断迭代训练ORELM,将多个训练好初始权值和偏置的ORELM模型组合在一起,得到强化后的ORELM模型,克服了原始的基础ORELM模型预测结果不稳定的问题,同时增强了单个ORELM在大多步预测中对船舶姿态序列的学习能力;
[0027]为便于实施参考起见,以下介绍ORELM预测模型原理:
[0028]ORELM在极限学习机(ELM)的基础上,采用l1范数与ELM模型相结合,以减少异常值的干扰,通过引入调节参数C,权衡训练误差与输出权重,以此提高ORELM模型的泛化性能以及对异常值的鲁棒性。
[0029]ORELM的损失函数如下式所示:
[0030][0031]s.t Y
‑<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的船舶运动大多步实时预测混合方法,其特征在于,包括如下步骤:1)由船舶上安装的姿态传感器获取原始船舶运动数据,将原始船舶运动数据划分为训练数据集和预测数据集;2)单独对步骤1)划分好的训练数据集和预测数据集进行实时小波包分解RTWPD,将船舶运动数据的高频分量和低频分量分解为固定层数的子序列,其中,低频分量的每个子序列的波动性更小,高频分量变化规律之间的映射关系更易被模型学习;3)对步骤2)分解得到的每个子序列建立ORELM基础预测模型,并引入AdaBoost.MRT强化学习方式,通过不断迭代训练ORELM,将多个训练好初始权值和偏置的ORELM模型组合在一起,避免ORELM模型预测结果不稳定,同时增强单个ORELM在大多步预测中对船舶姿态序列的学习能力;4)最后将子序列的预测结果重构得到模型大多步初始预测结果,大多步初始预测结果与实际结果相减得到大多步预测误差,对大多步预测误差建立LSSVM误差修正模型,通过误差修正模型进一步提取包含在大多步误差序列中少部分船舶运动数据的变化规律,进而对大多步初始预测结果进行修正,得到最终的船舶运动大多步预测结果并输出。2.根据权利要求1所述的一种基于强化学习的船舶运动大多步实时预测混合方法,其特征在于:步骤1)中,训练数据集用于训练初始ORELM模型以及AdaBoost.MRT算法强化ORELM;预测数据集再划分为验证集和测试集,验证集预测误差用于建立误差修正模型,测试集用于验证所提模型的预测性能。3.根据权利要求1所述的一种基于强化学习的船舶运动大多步实时预测混合方法,其特征在于:步骤2)中,船舶运动序列训练部分使用3层WPD分解结构,通过小波包分解WPD将船舶运动序列训练部分S(t)映射到23个小波包子空间中,分别为S(3,0)、S(3,1)、S(3,2)、S(3,3)、S(3,4)、...

【专利技术属性】
技术研发人员:陈泽宗魏鋆宇赵晨涂远辉
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1