【技术实现步骤摘要】
本专利技术属于多无人机协同控制,具体涉及一种基于动态有向图通讯结构的多无人机协调控制方法。
技术介绍
1、近年来,协同多无人机强化学习技术作为解决现实场景中复杂协同任务的重要框架而出现,吸引了大量关注,在实际应用和商业方面已经展现出巨大的潜力。集中式的协作marl方法是将多无人机系统作为一个整体,然后使用单无人机方法学习整体的策略。但这种方法面临着可扩展性不足的问题与设置中央控制器的局限性。分布式的协作marl方法是将无人机作为单独的个体,使用单无人机方法学习个体的策略,虽然解决了中央控制器的局限性,但导致了非平稳性和信用分配问题。为了解决这些问题,现有的多无人机强化学习算法主要采用集中式训练与分布式执行(centralized training with decentralizedexecution,ctde)范式。这种范式需要依赖访问全局状态,而可以访问全局状态的设置通常是一个理想化的假设,且在现实世界中通常不存在中央训练器。相比之下,研究无人机之间的通讯更加具有实际意义。
2、在多无人机系统中,通讯对于信息共享、学习和
...【技术保护点】
1.一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述邻接轨迹矩阵表示多无人机的通讯结构,邻接轨迹矩阵为布尔矩阵,矩阵元素的值表示无人机之间是否存在通讯。
3.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述基于局部观测值与历史隐藏状态计算预通讯信息,具体包括:
4.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述输入当前邻接轨迹矩阵和预通讯
...【技术特征摘要】
1.一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述邻接轨迹矩阵表示多无人机的通讯结构,邻接轨迹矩阵为布尔矩阵,矩阵元素的值表示无人机之间是否存在通讯。
3.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述基于局部观测值与历史隐藏状态计算预通讯信息,具体包括:
4.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述输入当前邻接轨迹矩阵和预通讯信息至多钥匙门控通讯网络,计算下一时刻的邻接轨迹矩阵的过程,具体包括:
5.根据权利要求1所述的一种基于动态有向图通讯结构的多无人机协调控制方法,其特征在于,所述各无人机基于预通讯信息及下一时刻的邻接轨迹矩阵通过基于transformer的解...
【专利技术属性】
技术研发人员:何斌,陈杰,程斌,张卓辉,刘晨隆,
申请(专利权)人:同济大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。