一种基于深度强化学习的无人机机场集群调度方法技术

技术编号：41300444 阅读：15 留言：0更新日期：2024-05-13 14:47

本发明专利技术提供了一种基于深度强化学习的无人机机场集群调度方法，包括：构建电力输电场景的无人机机场集群仿真环境；建立Transformer神经网络模型，采用Transformer神经网络模型对无人机当前状态下采取的行动决策打分，评估决策的价值；在仿真环境中，采用Transformer神经网络模型拟合动作价值函数，所述动作价值函数的输出为无人机下一步动作的概率，得到无人机最佳动作调度；实时采集区域内无人机的状态，将无人机的状态输入到动作价值函数中，输出最佳动作调度，无人机以最大回报完成任务。本方法采用深度强化学习方法训练模型，输出无人机动作预测，从而实现无人机的智能调度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电力系统运行检修，尤其是涉及一种基于深度强化学习的无人机机场集群调度方法。

技术介绍

1、高压输电线路一般用于长距离野外电力输送场景，受地理环境和环境气候影响，且线路多位于高空，巡检难度较大，因此越来越多使用无人机替代人工巡检。受制于无人机电量和飞行距离影响，电力输电场景中，一般会根据需求选取多个重要的地点部署无人机机场，无任务时，无人机停靠在机场内补充电量，当有新任务时，需要根据任务位置和性质，调度合适的无人机飞行到任务地点进行排查，甚至处置。当有大量无人机被部署之后，调度任务随之复杂化，如何高效调度所有无人机，使得可能随时产生的多个任务被及时处理是现在电力输电巡检中面临的关键问题之一。

2、中国专利技术专利名称：一种无人机调度方法及系统，申请号：202110351946.2，明公开了一种无人机调度方法及系统，涉及电力系统运行检修
所述方法包括获取飞行任务信息；根据所述任务信息以及若干可供调度的无人机信息，构建数学模型；每个所述无人机对应一个无人机站；通过神经网络算法对所述数学模型进行处理，随机生成调度方案集；其中，所述调度方案集包括若干种调度方案；从若干调度方案中选择总飞行里程最短的方案，作为最优调度方案。

3、无人机机场集群调度问题涉及到动态环境中的任务分配、资源利用效率等复杂问题。传统的遗传算法、粒子群算法等在面对这些问题时往往受限于模型的复杂性和实际情况的变化，效果并不理想。强化学习是一种通过智能体与环境的交互实现学习的机器学习方法。无人机通过观察环境状态，采取相应的行动，

技术实现思路

1、针对现有技术中存在的问题，本专利技术提供了一种基于深度强化学习的无人机机场集群调度方法，该方法考虑了电力巡检场景中无人机状态信息和环境状态信息，采用深度强化学习方法训练模型，输出无人机动作预测，从而实现无人机的智能调度。

2、本专利技术采用的技术方案如下：

3、一种基于深度强化学习的无人机机场集群调度方法，包括：

4、s0、构建电力输电场景的无人机机场集群仿真环境；

5、s1、建立transformer神经网络模型，采用transformer神经网络模型对无人机当前状态下采取的行动决策打分，评估决策的价值；

6、s2、在仿真环境中，采用transformer神经网络模型拟合动作价值函数，所述动作价值函数的输出为无人机下一步动作的概率，得到无人机最佳动作调度；

7、s3、实时采集区域内无人机的状态，将无人机的状态输入到动作价值函数中，输出最佳动作调度，无人机以最大回报完成任务。

8、一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被计算机处理器执行时，用于实现所述的基于深度强化学习的无人机机场集群调度方法。

9、本专利技术的有益效果为：本专利技术在无人机任务分配的角度、无人机的调度的角度、能源管理的角度，结合transformer神经网络模型和价值评估方法，提高任务完成率和效率。

本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的无人机机场集群调度方法，其特征在于，包括：

2.如权利要求1所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，所述方法还包括：确认影响无人机机场集群调度方案的主要因素。

3.如权利要求2所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，所述主要因素包括：无人机任务的分配因素、无人机的调度因素、无人机的能源管理因素。

4.如权利要求3所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，无人机任务的分配因素具体包括：

5.如权利要求3所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，无人机的调度因素具体包括：

6.如权利要求3所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，无人机的能源管理因素具体包括：

7.如权利要求1或4或5所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，建立Transformer神经网络模型具体为：

8.一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程

...

【技术特征摘要】

1.一种基于深度强化学习的无人机机场集群调度方法，其特征在于，包括：

2.如权利要求1所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，所述方法还包括：确认影响无人机机场集群调度方案的主要因素。

4.如权利要求3所述的基于深度强化学习的无人机机场集群调度方法，其特征在于，无人机任务的分配因素具体包括：

5.如权利要求3所述的基于深...

【专利技术属性】
技术研发人员：高岩，赵砚青，张悦，胡志坤，范满，吴晗，
申请(专利权)人：智洋创新科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人