一种用于UUV集群的强化学习算法研究平台制造技术

技术编号:26891310 阅读:40 留言:0更新日期:2020-12-29 16:09
本发明专利技术属于UUV集群研究技术领域,具体涉及一种用于UUV集群的强化学习算法研究平台。本发明专利技术解决了在研究用于UUV集群决策控制的强化学习算法时,需要对所研究的强化学习算法进行训练和结果验证的问题。本发明专利技术不仅可以快速对所研究的强化学习算法进行训练,而且还能对其决策控制效果进行验证,避免了直接进行UUV集群水下实验所耗费的大量时间和可能产生的未知风险,满足了算法研究人员对实验的需求。本发明专利技术能方便的对UUV集群强化学习算法进行训练和验证,从而极大的提高UUV集群的强化学习算法研发效率。本发明专利技术采用模块化设计,具有较好的扩展性,便于定制化。

【技术实现步骤摘要】
一种用于UUV集群的强化学习算法研究平台
本专利技术属于UUV集群研究
,具体涉及一种用于UUV集群的强化学习算法研究平台。
技术介绍
UUV集群的决策控制是UUV研究邻域的一个重要研究方向,是UUV集群完成任务目标的关键技术,应用强化学习技术来解决UUV集群的决策控制问题是一种有效的方法,然而针对UUV集群的强化学习算法需要大量的数据对算法进行训练,这就导致需要进行大量的实验来获取这些数据,如果直接使用UUV进行水下实验,不仅效率低,而且风险极高,很容易对UUV造成不可逆的伤害。为了满足算法研究人员对实验的需求,一种用于UUV集群的强化学习算法研究平台必须具备以下条件:在软件层面,能对UUV集群及其作业环境进行仿真;能与强化学习算法进行交互,提供算法所需的训练数据并执行算法的输出;能简单的进行算法的更改或替换,在硬件层面,能对UUV集群的规模进行简单方便的扩展;能根据实际需求进行定制化设计。
技术实现思路
本专利技术的目的在于克服UUV集群强化学习算法的训练以及验证困难的问题,提供一种用于UUV集群的强化学习算法研究平台。<本文档来自技高网...

【技术保护点】
1.一种用于UUV集群的强化学习算法研究平台,其特征在于:包括UUV集群仿真模块、水下环境仿真模块和强化学习模块;/n所述的UUV集群仿真模块由UUV集群中每一个单体UUV的仿真模块构成;所述的单体UUV的仿真模块包括任务处理模块、运动控制模块和动力学模型模块;所述的任务处理模块接收UUV的任务指令,将任务指令解析为UUV具体的航向指令、速度指令以及深度指令,并将解析后的指令传输到运动控制模块;所述的运动控制模块根据接收到的航向指令、速度指令以及深度指令计算每个执行机构的控制指令,并将每个执行机构的控制指令传输到动力学模型模块;所述的动力学模型模块将接收到的执行机构控制指令作用于UUV,计算得...

【技术特征摘要】
1.一种用于UUV集群的强化学习算法研究平台,其特征在于:包括UUV集群仿真模块、水下环境仿真模块和强化学习模块;
所述的UUV集群仿真模块由UUV集群中每一个单体UUV的仿真模块构成;所述的单体UUV的仿真模块包括任务处理模块、运动控制模块和动力学模型模块;所述的任务处理模块接收UUV的任务指令,将任务指令解析为UUV具体的航向指令、速度指令以及深度指令,并将解析后的指令传输到运动控制模块;所述的运动控制模块根据接收到的航向指令、速度指令以及深度指令计算每个执行机构的控制指令,并将每个执行机构的控制指令传输到动力学模型模块;所述的动力学模型模块将接收到的执行机构控制指令作用于UUV,计算得到下一个时间步长...

【专利技术属性】
技术研发人员:徐健黄飞邢文张耕实李娟
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江;23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1