一种基于智能机巢辅助协同的多无人机自适应作业方法技术

技术编号：40525176 阅读：6 留言：0更新日期：2024-03-01 13:44

本发明专利技术涉及智能机巢技术领域，公开了一种基于智能机巢辅助协同的多无人机自适应作业方法，包括机巢端和无人机，还包括以下步骤：每架无人机按照预测的初始信息进行飞行，每架无人机到达对应目标位置后，给机巢端反馈相应信息，并记录目标情况和未作业目标；若有无人机发现新的目标，无人机向机巢端发出请求，机巢端默认发现新目标的无人机作为该目标的最优作业对象；机巢端根据预设好的优化算法，将每架无人机当前代价信息和原本作业信息作为输入，输出更新后的新作业目标集合，并发送至对应无人机上；不同的无人机收到机巢端的信息，自适应调整无人机的姿态；本发明专利技术具有解决无人机远程协同交互和分配新工作的问题、提高任务工作效率的优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于智能机巢辅助协同的多无人机自适应作业方法，属于智能机巢的。

技术介绍

1、目前在无人机的电力巡检中，多无人机的协同工作与搜索任务通常是由集中分配算法或是人工分配等方式进行协同工作。这种方式是通过寻优算法或是人力手动分配无人机搜索来进行的，虽然可以达到初始优化的分配需求或工作效果，但对于现场工作的临时性或应急性而言，该方案却并不利于临时变更增加工作任务，也就难以达到实时的全局最优效果。毕竟就自动执行而言，无人机飞行航点程序已经捎入系统，改变则会打乱原本最优方案。

2、现有的应急性变更的技术方案多为：将工作任务重新按照无人机当前的位置和电量等目标状态作为输入，再通过优化模型得到新的搜索方案。但是该方案缺乏及时性和不确定性，并且一些物理数据如无人机当前坐标位置，姿态等等都不便于获取，还需要通过工作人员收回无人机才可实现对其的获取，产生了大量的不必要时间、降低了巡检的效率和无人机能耗。同时，重新召回无人机的方式还缺乏了任务执行的实时性与便利性，并且在一些正在工作的环境中，如山地、危险地带不利于工作人员进行无人机收回与信息获取再分配。而其他常见的方法，如在线通过一些服务器等方式进行临时分配虽然可行，但也需要无人机当前的数据信息，位置和状态等等，此类数据也需要重新的读取，存在有效率低下的问题。且多无人机之间如果想通过相互以蓝牙或wifi等方式共享数据又会因为可能存在远距离或是输电线场的电磁场等干扰而无法进行造成中断信号。

技术实现思路

1、为了解决现有技术所存

2、本专利技术的技术方案如下：

3、一种基于智能机巢辅助协同的多无人机自适应作业方法，包括机巢端和若干架无人机，机巢端与所有无人机进行通讯连接，还包括以下步骤：

4、每架无人机按照预测的初始作业路线和作业目标进行飞行，每架无人机到达对应目标位置后，给机巢端反馈目标的搜索信息与所需花费的代价，并记录已经工作的目标情况和未作业目标；

5、若有无人机发现新的一个或多个目标出现以后，无人机向机巢端发出请求，机巢端默认发现新目标的无人机作为该目标的最优作业对象；

6、机巢端根据预设好的优化算法，将每架无人机当前的代价信息和原本的作业信息作为输入，输出更新以后的每架无人机的新作业目标集合，并发送至对应无人机上；

7、不同的无人机收到机巢端的信息，自适应调整无人机的姿态。

8、进一步的，所述机巢端的优化算法为采用融合概率增强算法与pe—imlp模型，机巢端优化算法包括以下计算步骤：

9、步骤a1：机巢端接收到新数据后，对历史数据进行排除和更新；

10、步骤a2：根据无人机当前的位置情况，保留原本方案作为第一代对照；

11、步骤a3：对数据目标进行高斯消抖，将过远不合理分配目标进行滤波处理。

12、步骤a4：计算当前执行动作下的各无人机下的目标代价情况；

13、步骤a5：将每个无人机的可执行动作目标转为相应概率，并设置置信度阈值，当目标概率低于一定条件时则过滤该目标对象，增强其余动作选择倾向；

14、步骤a6：将每个无人机的当前状态以及各动作的发生概率作为输入，传入隐藏层中进行卷积，训练集为每次机巢存有的数据点坐标，标签为通过进化算法所得出最优路线下的下一个目标点的选择概率；

15、步骤a7：对softmax层输出的结果进行倾向性选择的概率增强，对比新旧方案在各位置上的增减，采用梯度下降的方式进行优化，更新卷积网络的权重；

16、步骤a8：设置赏罚函数，对得到优化的目标进行奖赏增强概率动作，对于劣化目标进行惩罚减少动作倾向；

17、步骤a9：在步骤a8下，重新更新动作倾向，并计算最大动作目标的回报值q，以及对应的方案，并重新进入步骤a4。

18、步骤a10：最终在优化训练n代后，输出执行概率，并选择最大目标概率的倾向动作，即为当前无人机状态下的最佳执行动作，n＝t，t为常数。

19、进一步的，所述融合概率增强算法包括以下计算步骤：

20、假设作业目标数为k个，且每个目标仅由一架无人机进行作业，则可执行状态为k-1个，按当前无人机所在位置的状态s下进行决策，决策函数p的公式为：

21、pj＝p(a|si_j)

22、p(a|si_j)＝p(a,si_j)/p(si_j)

23、

24、

25、式中，pj表示无人机j在第i种状态si_j下采取动作a的概率，p(a,si_j)表示无人机j在第i种状态si_j下采取动作a的集合，p(si_j)表示无人机j在第i种状态si_j下所有动作的集合，xi_j表示作业状态，x取0或1，取1时表示机巢分配该无人机进行目标i的作业，取0时无作业进行，m表示在m中无人机j还可分配作业的目标点，m表示无人机j根据机巢发布分配的目标集合，di_j表示无人机j从起飞处到第i个目标的距离；k表示作业目标数；

26、定义环境的状态空间和动作空间，将当前状态s和动作a作为输入，输出一个q值，表示在当前状态下采取某个动作的预期回报；对于状态动作回报值函数q的公式为：

27、q(s+1)＝wq(s)+α*[rs+1+γv(s+1)]

28、式中，q(s+1)表示在下一个状态s+1下选择动作的期望q值，w表示增强权重，取值为w＝1-α，q(s)表示在状态s下采取动作a的预期回报，α表示学习率，取0.4～0.6，rs+1表示在状态s+1下选择的即时奖励，γ表示折扣因子，取0～1，st表示时间步t的状态；

29、设置状态值v(s)表示状态s时的值函数，初始状态值v(0)＝0，状态值v(s)的公式为：

30、

31、

32、式中，v(s)表示状态s时的值函数，e表示对下一个状态s取向的期望值，通过对可能发生的所有状态转换和即时回报进行平均后算得，也就是在m个可行的动作目标下，得到期望的平均值作为下一状态v(s+1)的状态值，rt+1表示在时间步t+1的即时奖励，pt表示时间步t下采取对应动作的概率，pt表示时间步t+1下采取对应动作的概率，m表示无人机根据机巢发布分配的目标集合。

33、进一步的，所述pe—imlp模型的训练过程包括以下步骤：将各无人机所生成的动作倾向概率预测发生的最大动作的回报值q，作为pe—imlp模型的输出，将当前所有无人机位置和作业目标位置作为pe—imlp模型的输入，计算环境奖励值，环境奖励值的计算公式为：

34、

35、式中，r表示环境奖励值，θ表示基础奖励值，t表示完成完成作业所需要花费的时间，d表示完成作业所飞行的形成距离，n表示完成作业所使用的无人机个数，tg表示使用增强算法估计下完成作业所需要花费的时间，dg表示使用增强算法估计下完成作业所飞本文档来自技高网...

【技术保护点】

1.一种基于智能机巢辅助协同的多无人机自适应作业方法，包括机巢端和若干架无人机，机巢端与所有无人机进行通讯连接，其特征在于：还包括以下步骤：

2.根据权利要求1所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述机巢端的优化算法为采用融合概率增强算法与PE—IMLP模型，机巢端优化算法包括以下计算步骤：

3.根据权利要求2所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述融合概率增强算法包括以下计算步骤：

4.根据权利要求3所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述PE—IMLP模型的训练过程包括以下步骤：将各无人机所生成的动作倾向概率预测发生的最大动作的回报值Q，作为PE—IMLP模型的输出，将当前所有无人机位置和作业目标位置作为PE—IMLP模型的输入，计算环境奖励值，环境奖励值的计算公式为：

5.根据权利要求4所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述PE—IMLP模型的训练过程还包括以下步骤：

6.根据权利要求5

7.根据权利要求5所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述步骤B6中损失函数的计算公式为：

8.根据权利要求7所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述步骤B7中反向传播算法的计算公式为：

9.根据权利要求5所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述无人机的自适应调整方法包括以下步骤：

...

【技术特征摘要】

2.根据权利要求1所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述机巢端的优化算法为采用融合概率增强算法与pe—imlp模型，机巢端优化算法包括以下计算步骤：

3.根据权利要求2所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述融合概率增强算法包括以下计算步骤：

4.根据权利要求3所述的一种基于智能机巢辅助协同的多无人机自适应作业方法，其特征在于：所述pe—imlp模型的训练过程包括以下步骤：将各无人机所生成的动作倾向概率预测发生的最大动作的回报值q，作为pe—imlp模型的输出，将当前所有无人机位置和作业目标位置作为pe—iml...

【专利技术属性】
技术研发人员：汤奕琛，孙嫱，林永翔，陈杰，李郭然，沈滨，黄宇升，沈如榕，陈彬，朱仕焜，
申请(专利权)人：国网福建省电力有限公司漳州供电公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人