本发明专利技术公开了一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法、设备及存储介质,属于气垫船垫升控制领域。本发明专利技术通过采用基于生成对抗模仿学习的控制方法,使用渐进式训练的方式,实现全垫升气垫船垫升压力的智能控制。本发明专利技术采用的生成对抗模型包括多变分自编码器和LSTM网络组合的专家数据判别器和使用SAC网络作为垫升状态控制变量生成器,通过两个模型的对抗训练,同时提升两个网络模型的性能。本发明专利技术提出的渐进式训练方式充分利用了现有的非实物仿真数据、气垫船驾驶模拟器数据和有限的专家数据提升网络性能,达到对专家数据的模仿。本发明专利技术解决了全垫升气垫船各垫升操控过于依赖驾驶员经验等问题,降低垫升操纵难度。
【技术实现步骤摘要】
本专利技术属于气垫船垫升控制领域,尤其涉及一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法、设备及存储介质。
技术介绍
1、全垫升气垫船是一种通过垫升系统悬浮于水面、陆地、沼泽等复杂环境下的两栖特种船舶,由于良好的机动性和快速性,其被广泛应用于海军装备和民用救援等。气垫船的垫升系统的存在降低行驶阻力的同时增加气垫船的不稳定性,因此研究气垫船垫升系统压力控制技术具有重要的意义。垫升压力控制是根据气垫船的状态,结合实际任务要求调节压力控制机构,控制气垫压力,使气垫船保持稳定。在以往的垫升压力控制研究中主要是基于传统控制方法的垫升风机流量—压力控制,结合压力传感器的放气阀控制和依赖围裙设计的气垫压力被动控制。以上方式依赖手动调节和传统控制方法,垫升效果取决于驾驶员的操作经验。随着计算机计算能力的提升和各类精密传感器的诞生,驾驶员操作流程以及环境信息能够被精确的记录,而生成对抗模仿学习是基于生成对抗网络而构建的,在样本充足的条件下能够获得和专家数据一样的数据分布,采用此方法学习驾驶员操纵数据,辅助驾驶员操作,降低控制垫升压力系统的难度。</p>
...
【技术保护点】
1.一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,包括:
2.根据权利要求1所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,所述步骤1具体包括:
3.根据权利要求1所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,所述步骤3包括以下步骤:
4.根据权利要求3所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,步骤3.2中,所述预训练垫升状态控制变量生成器为Actor网络输入Sj,输出Aj,再使用无监督的方法对Actor网络进行预训练;先随机初始化垫升状态控制变量生成...
【技术特征摘要】
1.一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,包括:
2.根据权利要求1所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,所述步骤1具体包括:
3.根据权利要求1所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,所述步骤3包括以下步骤:
4.根据权利要求3所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,步骤3.2中,所述预训练垫升状态控制变量生成器为actor网络输入sj,输出aj,再使用无监督的方法对actor网络进行预训练;先随机初始化垫升状态控制变量生成器的参数,然后使用一个自编码器对垫升状态控制变量生成器进行训练;自编码器的输入为随机噪声,输出为actor网络的输出,中间层为垫升状态控制变量生成器的隐层;
5.根据权利要求3所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,所述步骤3.3对抗训练具体包括以下步骤:
6.根据权利要求5所述一种基于生成对抗模仿学习的全垫升气垫船垫升压力控制方法,其特征在于,步骤3.3.1中,所述专家数据序列获取为:向垫升状态控制生成器中的actor网络输入专家特...
【专利技术属性】
技术研发人员:王元慧,程基涛,张潇月,高嵩,王成龙,张驰,鄂继洋,赵歆雅慧,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。