当前位置: 首页 > 专利查询>北京圣涛平试验工程技术研究院有限责任公司专利>正文

多智能体对抗神经网络训练方法及装置制造方法及图纸

技术编号：27319398 阅读：36 留言：0更新日期：2021-02-10 09:57

本发明专利技术提供一种多智能体对抗神经网络训练方法及装置，该方法包括：对影响智能体的RMS指标进行分析，提取影响总体性能的关键指标，并确定关键指标的取值；采用蒙特卡洛方法，模拟多智能体在关键指标情况下的实际状态；根据实际状态，对构建的多智能体对抗神经网络进行训练。该方法在可靠性、维修性、保障性参数的约束下，在不改变原有的神经网络结构下，进行神经网络的参数优化，使其能够在多智能体出现可靠性问题时，仍能够达到较为理想的性能。本发明专利技术可以提高多智能体对抗神经网络的健壮性或鲁棒性，在面对实际物理世界中代理可能发生的故障和维修等场景，采用本发明专利技术进行训练的神经网络具有更高的系统性能，降低代理故障对于系统性能的影响。统性能的影响。统性能的影响。

全部详细技术资料下载

【技术实现步骤摘要】
多智能体对抗神经网络训练方法及装置

[0001]本专利技术涉及机器学习
，尤其涉及一种多智能体对抗神经网络训练方法及装置。

技术介绍

[0002]多智能体控制体系增强学习建模时，输入条件中的智能体数量和性能通常是已知的，以此为约束条件进行网络参数优化，以得到效能最好的控制模型。智能网络通过控制信号对多智能体进行控制，使其成为一个整体并且效能最优。
[0003]但是，物理世界中的智能体并非理想的智能体，需要进行维修和维护，或者在执行任务时出现故障，不能执行正常的功能，原约束条件已不在成立，由此建立的控制模型并非效能最高的。

技术实现思路

[0004]针对现有技术存在的问题，本专利技术提供一种多智能体对抗神经网络训练方法及装置。
[0005]本专利技术提供一种多智能体对抗神经网络训练方法，包括：对影响智能体的可靠性、维修性和保障性指标进行分析，提取影响总体性能的关键指标，并确定关键指标的取值；每次训练时，采用蒙特卡洛方法，模拟多智能体在所述关键指标情况下的实际状态；根据所述实际状态，对构建的多智能体对抗神经网络进行训练。
[0006]根据本专利技术一个的多智能体对抗神经网络训练方法，所述根据所述实际状态，对构建的多智能体对抗神经网络进行训练，包括：根据所述实际状态，确定输入环境变量，以回报最大化为目标，对构建的多智能体强对抗神经网络进行训练。
[0007]根据本专利技术一个的多智能体对抗神经网络训练方法，所述多智能体为执行任务的飞机集群，相应地：所述多智能体对抗神经网...

【技术保护点】

【技术特征摘要】
1.一种多智能体对抗神经网络训练方法，其特征在于，包括：对影响智能体的可靠性、维修性和保障性指标进行分析，提取影响总体性能的关键指标，并确定关键指标的取值；每次训练时，采用蒙特卡洛方法，模拟多智能体在所述关键指标情况下的实际状态；根据所述实际状态，对构建的多智能体对抗神经网络进行训练。2.根据权利要求1所述的多智能体对抗神经网络训练方法，其特征在于，所述根据所述实际状态，对构建的多智能体对抗神经网络进行训练，包括：根据所述实际状态，确定输入环境变量，以回报最大化为目标，对构建的多智能体强对抗神经网络进行训练。3.根据权利要求1所述的多智能体对抗神经网络训练方法，其特征在于，所述多智能体为执行任务的飞机集群，相应地：所述多智能体对抗神经网络，用于评估所述飞机集群任务成功率；所述关键指标，包括：飞机的失效率、战备完好率和通信中断率。4.根据权利要求3所述的多智能体对抗神经网络训练方法，其特征在于，所述采用蒙特卡洛方法，模拟多智能体在所述关键指标情况下的实际状态，包括：根据飞机总架数和战备完好率，采用蒙特卡洛方法，确定能出动的飞机架数。5.根据权利要求4所述的多智能体对抗神经网络训练方法，其特征在于，所述采用蒙特卡洛方法，模拟多智能体在所述关键指标情况下的实际状态，还包括：根据能出动的飞机架数和飞机失效率，采用蒙特卡洛方法，确定故障飞机，并将故障飞机移除，得到可执行任...

【专利技术属性】
技术研发人员：白桦，王群勇，孙旭朋，
申请(专利权)人：北京圣涛平试验工程技术研究院有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人