一种网络化无中心式多节点协同决策控制方法技术

技术编号：41719132 阅读：38 留言：0更新日期：2024-06-19 12:45

本发明专利技术公开了一种网络化无中心式多节点协同决策控制方法，属于高速飞行器协同决策控制技术领域，特别适用于多飞行器协同执行任务的场景。本发明专利技术是一种预训练结合强化学习的决策模型生成方法，提高了模型的收敛效率，降低了训练成本。该方法在强化学习训练之前加入针对高速飞行器的预训练，并且对强化学习训练过程中策略网络更新的方式进行改进，从两方面同时减少样本需求量、提高训练效率，从而提升协同决策模型的收敛速度和收敛结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及高速飞行器协同决策控制，具体涉及一种网络化无中心式多节点协同决策控制方法，特别适用于多飞行器协同执行任务的场景。

技术介绍

1、速度在5马赫以上的飞行器均可称为高速飞行器，其包括高超音速巡航导弹、高超音速飞机、航天飞机。在高速飞行器决策控制领域，传统的协同决策控制方法通常采用集中式的架构。整个系统的决策和控制过程由一个中心节点负责，其优势在于简化系统设计和管理。然而，面向高速飞行器，上述设计方法面临一系列挑战。

2、(1)集中式设计容易受到单点故障的威胁。由于整个系统的决策核心位于一个节点，一旦该节点发生故障，高速飞行器的系统性能将受到重大损害，甚至可能导致系统崩溃。

3、(2)节点间的通信成为系统性能的瓶颈。在信息量巨大或需要实时响应的情况下，集中式方法存在的节点通信延迟可能会显著影响整个系统的性能。对于高速飞行器这类对实时决策要求极高的对象，上述风险显然是无法接受的。

4、(3)传统的飞行器决策系统在应对复杂、动态环境时适应性不足。传统方法通常缺乏有效机制来动态调整决策策略，从而难以...

【技术保护点】

1.一种网络化无中心式多节点协同决策控制方法，其特征在于，数量为N的高速飞行器，共同执行一任务，每个高速飞行器都是一个单独节点，根据感知获得的自身态势和通信获得的友方态势，包括如下步骤：

2.如权利要求1所述的一种网络化无中心式多节点协同决策控制方法，其特征在于，所述以状态-动作对为中心设计预训练网络，具体为：

3.如权利要求1所述的一种网络化无中心式多节点协同决策控制方法，其特征在于，所述让决策模型与各自环境进行交互；其中，决策模型输出的动作为初始策略与目标策略的组合，具体为：

4.如权利要求1所述的一种网络化无中心式多节点协同决策控制方法，其特征在...

【技术特征摘要】

1.一种网络化无中心式多节点协同决策控制方法，其特征在于，数量为n的高速飞行器，共同执行一任务，每个高速飞行器都是一个单独节点，根据感知获得的自身态势和通信获得的友方态势，包括如下步骤：

2.如权利要求1所述的一种网络化无中心式多节点协同决策控制方法，其特征在于，所述以状态-动作对为中心设计预训练网络，具体为：

3.如权利要求1所述的一种网络化无中心式多节点协同决策控制方法，其特征在于，所述让决策模型与各自环境进行交互；其中，决策模型输出的动作为初始策略与目标策略的...

【专利技术属性】
技术研发人员：王玥，李柯绪，庄星，王予泽，吴若愚，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人