【技术实现步骤摘要】
一种多无人艇协同编队控制方法及系统
本专利技术涉及海洋智能无人艇协同作业领域,特别是涉及一种多无人艇协同编队控制方法及系统。
技术介绍
多无人艇系统的高性能和高效率促进了无人艇在民用领域和军事领域的进一步应用。与单个无人艇相比,多无人艇系统具有较强的适应性和容错性。多无人艇系统组成的编队可以在航行期间形成动态网络,通过分区与合作,每个无人艇都可以快速、准确地感知到该地区的环境信息,从而加速完成任务并提高系统效率。特别是,编队控制是多无人艇系统协同控制的最基本问题,必须采取集体计划以确保多无人艇系统内的无人艇共同完成一项任务并在时间和空间上进行协调。目前,现有多无人艇协同编队存在实时性差,不稳定,效率低等问题。
技术实现思路
本专利技术的目的是提供一种多无人艇协同编队控制方法及系统,旨在解决现有多无人艇协同编队实时性差、不稳定、效率低等问题。为实现上述目的,本专利技术提供了如下方案:一种多无人艇协同编队控制方法,包括:获取当前阶段无人艇团队执行的任务需求;根据所述任务需求确定 ...
【技术保护点】
1.一种多无人艇协同编队控制方法,其特征在于,包括:/n获取当前阶段无人艇团队执行的任务需求;/n根据所述任务需求确定当前阶段所述无人艇团队内每个无人艇所需的编队形状生成模型和编队形状维持模型;所述无人艇团队包括多个无人艇,分别为一个领航艇和多个跟随艇;所述编队形状生成模型是根据第一训练样本和优势深层确定性策略梯度网络结构训练得到;所述编队形状维持模型是根据第二训练样本和优势深层确定性策略梯度网络结构训练得到;/n确定当前时刻所述无人艇团队的执行阶段;所述执行阶段包括编队形状生成阶段和编队形状维持阶段;/n当所述无人艇团队处于所述编队形状生成阶段时,获取当前时刻每个所述无人 ...
【技术特征摘要】
1.一种多无人艇协同编队控制方法,其特征在于,包括:
获取当前阶段无人艇团队执行的任务需求;
根据所述任务需求确定当前阶段所述无人艇团队内每个无人艇所需的编队形状生成模型和编队形状维持模型;所述无人艇团队包括多个无人艇,分别为一个领航艇和多个跟随艇;所述编队形状生成模型是根据第一训练样本和优势深层确定性策略梯度网络结构训练得到;所述编队形状维持模型是根据第二训练样本和优势深层确定性策略梯度网络结构训练得到;
确定当前时刻所述无人艇团队的执行阶段;所述执行阶段包括编队形状生成阶段和编队形状维持阶段;
当所述无人艇团队处于所述编队形状生成阶段时,获取当前时刻每个所述无人艇对应的第一状态信息;所述第一状态信息包括当前无人艇的位置信息和速度信息,以及其他无人艇的位置信息和速度信息;
将每个所述无人艇对应的第一状态信息输入到相应的所述编队形状生成模型中以获取下一时刻每个无人艇的第一执行动作,并将所述第一执行动作发送至无人艇的执行结构以获取下一时刻的第一状态信息,直至所述无人艇团队的航行形状生成为所述任务需求对应的编队形状;
当所述无人艇团队处于所述编队形状维持阶段时,获取当前时刻每个所述跟随艇对应的第二状态信息;所述第二状态信息包括所述领航艇的位置信息和速度信息,以及当前跟随艇的位置信息和速度信息;
将每个所述跟随艇对应的所述第二状态信息输入到相应的所述编队形状维持模型以获取下一时刻每个跟随艇的第二执行动作,并将所述第二执行动作发送至跟随艇的执行结构以获取下一时刻的第二状态信息,直到所述无人艇团队的航行形状维持为所述任务需求对应的编队形状。
2.根据权利要求1所述的一种多无人艇协同编队控制方法,其特征在于,所述根据所述任务需求确定当前阶段所述无人艇团队内每个无人艇所需的编队形状生成模型和编队形状维持模型,具体包括:
根据所述任务需求确定所述无人艇团队的编队形状;
根据所述无人艇团队的编队形状,确定当前阶段所述无人艇团队内每个无人艇所需的编队形状生成模型和编队形状维持模型。
3.根据权利要求1所述的一种多无人艇协同编队控制方法,其特征在于,所述编队形状生成模型的构建过程为:
确定第一训练样本;所述第一训练样本为具有时间连续性的数据集;所述数据集包括多个样本集合;每个所述样本集合包括多个元素,分别为当前时刻第一状态信息,当前时刻执行动作,当前时刻奖励以及下一时刻第一状态信息;
构建优势深层确定性策略梯度网络结构;
将所述第一训练样本输入到所述优势深层确定性策略梯度网络结构中以对所述优势深层确定性策略梯度网络结构进行训练,进而得到编队形状生成模型。
4.根据权利要求3所述的一种多无人艇协同编队控制方法,其特征在于,所述确定第一训练样本,具体包括:
获取每个无人艇自身搭载的传感器采集的第t时刻自身位置信息和第t时刻自身速度信息,以及所述无人艇团队内其他无人艇的第t时刻其他位置信息和第t时刻其他速度信息;
将所述第t时刻自身位置信息、所述第t时刻自身速度信息、所述第t时刻其他位置信息和所述第t时刻其他速度信息合并为第t时刻第一状态信息;
获取每个无人艇自身搭载的传感器采集的第t时刻执行动作;
根据所述任务需求对应的编队形状确定每个无人艇的第t时刻奖励;
获取每个无人艇自身搭载的传感器采集的第t+1时刻自身位置信息和第t+1时刻自身速度信息,以及所述无人艇团队内其他无人艇的第t+1时刻其他位置信息和第t+1时刻其他速度信息;
将所述第t+1时刻自身位置信息、所述第t+1时刻自身速度信息、所述第t+1时刻其他位置信息和所述第t+1时刻其他速度信息合并为第t+1时刻第一状态信息;
构成第t时刻样本集合,并将所述第t时刻样本集合存储在共享经验重播缓冲区内;所述第t时刻样本集合包括第t时刻第一状态信息,第t时刻执行动作,第t时刻奖励以及第t+1时刻第一状态信息;
当所述存储在共享经验重播缓冲区内的数据达到设定数量后停止存储;停止存储后的所述存储在共享经验重播缓冲区内的数据为第一训练样本。
5.根据权利要求4所述的一种多无人艇协同编队控制方法,其特征在于,所述根据所述任务需求对应的编队形状确定每个无人艇的第t时刻奖励,具体包括:
根据公式和r2=-c1计算第i个无人艇的第t时刻奖励;
其中,第i个无人艇的第t时刻奖励为r1+r2,为编队形状中第i个无人艇的第t时刻编队节点nj位置,为第i个无人艇的第t时...
【专利技术属性】
技术研发人员:蒲华燕,刘源,罗均,谢志江,谢佳佳,李小毛,苏洲,彭艳,谢少荣,
申请(专利权)人:上海大学,重庆大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。