一种基于动态有向图通讯结构的多无人机协调控制方法技术

技术编号：45469200 阅读：22 留言：0更新日期：2025-06-06 22:02

本发明专利技术公开了一种基于动态有向图通讯结构的多无人机协调控制方法，包括在分布式执行阶段，利用局部观测值与历史隐藏状态，并结合邻接轨迹矩阵，通过多钥匙门控通讯网络动态调整无人机间的通讯结构。基于更新后的邻接轨迹矩阵与预通讯信息，计算局部动作值函数并更新隐藏状态，最终生成控制决策并执行。集中式训练阶段则通过记录各时刻的邻接轨迹矩阵与局部观测值，生成全局状态并利用混合网络生成全局动作值函数，进而通过奖励更新网络参数。训练后的图坍缩网络与混合网络部署到各无人机中，实现分布式执行。该方法有效提高了无人机群体的通讯效率、决策精度与协同能力，适用于复杂任务场景，具有较高的适应性、稳定性和实时性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于多无人机协同控制，具体涉及一种基于动态有向图通讯结构的多无人机协调控制方法。

技术介绍

1、近年来，协同多无人机强化学习技术作为解决现实场景中复杂协同任务的重要框架而出现，吸引了大量关注，在实际应用和商业方面已经展现出巨大的潜力。集中式的协作marl方法是将多无人机系统作为一个整体，然后使用单无人机方法学习整体的策略。但这种方法面临着可扩展性不足的问题与设置中央控制器的局限性。分布式的协作marl方法是将无人机作为单独的个体，使用单无人机方法学习个体的策略，虽然解决了中央控制器的局限性，但导致了非平稳性和信用分配问题。为了解决这些问题，现有的多无人机强化学习算法主要采用集中式训练与分布式执行(centralized training with decentralizedexecution,ctde)范式。这种范式需要依赖访问全局状态，而可以访问全局状态的设置通常是一个理想化的假设，且在现实世界中通常不存在中央训练器。相比之下，研究无人机之间的通讯更加具有实际意义。

2、在多无人机系统中，通讯对于信息共享、学习和...

【技术保护点】

1.一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，所述邻接轨迹矩阵表示多无人机的通讯结构，邻接轨迹矩阵为布尔矩阵，矩阵元素的值表示无人机之间是否存在通讯。

3.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，所述基于局部观测值与历史隐藏状态计算预通讯信息，具体包括：

4.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，所述输入当前邻接轨迹矩阵和预通讯信息至多钥匙门控通讯...

【技术特征摘要】

1.一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，包括以下步骤：

4.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，所述输入当前邻接轨迹矩阵和预通讯信息至多钥匙门控通讯网络，计算下一时刻的邻接轨迹矩阵的过程，具体包括：

5.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法，其特征在于，所述各无人机基于预通讯信息及下一时刻的邻接轨迹矩阵通过基于transformer的解...

【专利技术属性】
技术研发人员：何斌，陈杰，程斌，张卓辉，刘晨隆，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人