【技术实现步骤摘要】
一种多无人艇避碰决策控制系统
[0001]本专利技术属于无人艇避碰领域,具体涉及一种多无人艇避碰决策控制系统。
技术介绍
[0002]随着人工智能的快速发展,智能化体现在各个领域,传统船舶也迎来转折,以保障船员安全减少船员上船作业为目的的智能船舶和无人艇应运而生。无人船是无人驾驶技术研究的新领域,对于海洋开发利用,单条无人艇很难完美完成,无人艇集群可以有效完成水质采样、海上救援和辅助靠泊等协同作业任务。由于近海领域水体复杂以及船艇数量大,使无人艇在航行安全问题上面临严峻挑战,因此对无人艇航行控制与航行安全提出了更高要求。基于国际海上避碰规则(COLREGs)与船长经验提出一种适用于多无人艇航行避碰规则,对无人艇海上安全航行具有重要战略意义。
[0003]无人艇避碰研究中,一是当前技术大多针对单无人艇,对于无人艇集群研究较少,现阶段随着海洋开发利用逐步加大,应用场景逐步增多,对无人艇功能和数量提出更高要求,单无人艇限制了海上应用场景研究。二是当前技术大都停留在仿真阶段,从仿真到工程应用实现困难,且算法迭代趋于饱和,缺乏 ...
【技术保护点】
【技术特征摘要】
1.一种多无人艇避碰决策控制系统,其特征在于,包括终端、无人艇控制单元和底控单元;所述无人艇控制单元与终端通信连接;所述终端接收无人艇传感器数据获得环境信息与无人艇自身状态信息,通过避碰算法决策下一时刻无人船的状态,向无人艇控制单元发送下一时刻位置信息以及推力和力矩;所述无人艇控制单元根据接收到的数据信息,进行推力分配,并将推力分配指令发送给底层控制单元。2.根据权利要求1所述的一种多无人艇避碰决策控制系统,其特征在于,所述无人艇控制单元与终端利用socket通信,无人艇控制单元作为server,终端作为client;所述无人艇控制单元启动,终端获取无人艇控制单元IP与端口,与控制器建立连接。3.根据权利要求1所述的一种多无人艇避碰决策控制系统,其特征在于,所述底控单元通过PWM波驱动左右螺旋桨。4.根据权利要求1所述的一种多无人艇避碰决策控制系统,其特征在于,所述避碰算法,具体如下:步骤1:构建决策模型;步骤2:载入未知环境,训练模型;步骤3:设计测试环境,根据测试环境和当前无人艇位置状态,得到初步信息,用来进行下一时刻的决策;步骤4:监测周围环境信息,用相互速度障碍向量表示;步骤5:采用GRU神经网络对输入信息处理成相同维度;步骤6:每条无人艇的传感器需设置最大检测范围,接收信号为可检测范围内他艇尺寸、当前速度、当前艏向和避碰半径。获得局部环境的先验信息后,可实现局部避碰路径规划。步骤7:根据相互速度障碍算法评估,执行避碰行为、正常航行或加速行为;步骤8:根据无人艇当前状态与目标点的距离,反馈奖励,指导无人艇下一时刻的决策行为步骤9:模型通过与环境持续交互来学习动作策略,学习效果由每个训练事件的累积奖励值表示,计算总奖励值与结果。5.根据权利要求4所述的一种多无人艇避碰决策控制系统,其特征在于,所述决策模型,具体为:设置了两个actor网络,结构为两层,每层256个神经元;其中网络π采样,对旧网络π
old
更新;在训练循环期间,π接收当前环境信息,根据信息选择动作更新状态s'并返回奖励r;两个actor网络通过自适应KL惩罚,critic网络结构为两层,每层256个神经元,通过s',r评价动作好坏,对π更新。6.根据权利要求5所述的一种多无人艇避碰决策控制系统,其特征在于,所述决策模型参数更新方式为离线更新。7.根据权利要求4所述的一种多无人艇避碰决策控制系统,其特征在于,所述环境具体为:设计训练环境,近端策略优化算法优化目标是极大化奖励的期望,在计算期望时,采样方法选择重要性采样方法;
重要性采样是实现在参数为θ'网络下收集数据对θ网络更新的关键,用两个分布函数p,q来描述两条无人艇,计算期望公式如下:理论上q可以是任何分布,但在实际中p和q相近,从两个分布方差来看Var
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。