一种基于MA3C算法的无人机协同任务规划方法技术

技术编号:39400727 阅读:10 留言:0更新日期:2023-11-19 15:53
本发明专利技术涉及一种基于MA3C算法的无人机协同任务规划方法,属于无人机任务规划领域。该方法包括以下步骤:S1:建立无人机模型;S2:建立任务模型;S3:建模任务分配变量;S4:建模任务效用函数;S5:建模无人机协同任务规划约束条件;S6:确定无人机候选任务选择策略;S7:建模系统状态、动作和奖励;S8:建模并训练MA3C网络;S9:基于MA3C算法确定无人机协同任务分配及轨迹规划策略。本发明专利技术通过建立无人机模型以及任务模型,并建模任务分配变量以及无人机轨迹规划变量,确定最优的任务分配以及轨迹规划策略,从而实现无人机协同任务平均效用最大化以及无人机协同任务规划的高效应用。以及无人机协同任务规划的高效应用。以及无人机协同任务规划的高效应用。

【技术实现步骤摘要】
一种基于MA3C算法的无人机协同任务规划方法


[0001]本专利技术属于无人机任务规划领域,涉及一种基于
MA3C
算法的无人机协同任务规划方法


技术介绍

[0002]无人机任务的精准可靠执行依赖于合理高效的任务规划策略,需根据无人机所感知的环境信息

任务需求和机上任务载荷等多类约束条件,对任务要素进行综合分析,优化调度及部署多种资源,确定无人机任务分配及航迹规划策略,确保无人机以最佳方式完成任务;
[0003]随着无人机任务执行环境动态变化

任务需求复杂多样化,而单一无人机受到功能类型

机上载荷

飞行能力

电池电量等多因素的限制,其任务执行能力严重受限,多机协同技术通过单机间的密切协作,协同完成任务调度,可显著有效提升无人机任务执行能力,提高系统安全性

可靠性,已成为无人机应用发展的趋势

[0004]目前,对无人机协同任务规划问题进行研究包括:针对水下目标搜索和跟踪任务规划问题,将其建模为搜索空间最大化和终端误差最小化问题,通联合求解优化问题确定任务规划策略;又如,考虑灾难救援场景的多机任务执行场景,建模无人机路径规划问题为车辆路径变种问题,以实现路径长度最小化;然而,现有研究较少考虑面向多任务场景的任务分配

子任务之间存在关联关系问题,导致现有机制难以高效应用


技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于
MA3C
算法的无人机协同任务规划方法,解决无人机在执行多任务场景的任务分配

子任务之间存在关联关系低,导致现有机制难以高效应用的技术问题

[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种基于
MA3C
算法的无人机协同任务规划方法,该方法包括以下步骤:
[0008]S1
:建立无人机模型,包括任务资源模型和无人机任务能力模型;
[0009]S2
:建立任务模型,包括独立任务模型和组合任务模型,采用有向无环图
DAG
描述组合任务模型中各子任务之间关系;
[0010]S3
:建模任务分配变量;
[0011]S4
:建模任务效用函数;
[0012]S5
:建模无人机协同任务规划约束条件,包括任务约束条件建模和无人机约束条件建模;
[0013]所述任务约束条件建模包括:任务分配约束条件建模

任务执行约束条件建模和任务完成时间约束条件建模;
[0014]所述无人机约束条件建模包括:无人机性能约束条件建模和无人机安全约束条件建模;
[0015]所述无人机性能约束条件建模包括:无人机能量约束建模和无人机任务资源约束建模;
[0016]所述无人机安全约束条件建模包括:无人机飞行距离约束建模

无人机安全约束建模和无人机禁飞区约束建模;
[0017]S6
:根据任务资源可用性

任务的时效性和无人机能耗限制确定无人机候选任务选择策略;
[0018]S7
:建模系统在时隙的状态

动作和奖励;
[0019]S8
:建模并训练
MA3C
算法;
[0020]S9
:基于
MA3C
算法确定无人机协同任务分配及轨迹规划策略

[0021]进一步的,所述
S1
中,建立无人机模型,具体包括:
N
个无人机,定义
U
n
为第
n
架无人机,
1≤n≤N
;将系统时间划分为长度相等的时隙,定义
T
为时隙总数,
τ
为每个时隙长度;无人机飞行高度固定为
h
,定义
t
时隙
U
n
的二维坐标为
[0022]无人机从初始位置出发执行任务,能量耗尽前返回目的地,无人机的最大速度为
v
max
;令表示
U
n
在时隙
t
的飞行方向,
v
n,t
∈[0,v
max
]表示
U
n
在时隙
t
的飞行速度;
U
n
在时隙
t+1
的二维位置投影为:令表示初始时刻
U
n
的能量;无人机执行任务需消耗一定资源,令
Y
表示执行任务所需资源类型的数量,表示初始时刻
U
n
所携带的第
y
种类型资源的资源量,
1≤y≤Y。
[0023]进一步的,所述
S2
中,建立任务模型,具体包括:系统中包含
M
个任务,定义
Θ
m
为第
m
个任务,
1≤m≤M
,由四元组表示,其中
s
m

[s
m,1
,...,s
m,Y
]T
表示完全执行
Θ
m
所需要任务资源,
s
m,y
表示执行
Θ
m
所需要的第
y
种类型资源的资源量;
R
m
为无人机完全执行
Θ
m
可获得的收益;表示任务执行的截止时间;任务类型包括独立任务及组合任务;
[0024]独立任务无法拆分为子任务,仅当整个任务被完全执行时,才能获得相应的收益;
[0025]组合任务由多个可独立执行的子任务组成,
K
m
表示
Θ
m
的子任务数量,
Θ
m,i
表示
Θ
m
的第
i
个子任务,
1≤i≤K
m

[0026]若
Θ
m
为独立任务,则
K
m
=1,
Θ
m

Θ
m,i

[0027]若
Θ
m
为组合任务,则
K
m
>1;子任务
Θ
m,i
建模为二元组表示,其中
s
m,i

[s
m,i,1
,...,s
m,i,y
,...s
m,i,Y
]T
表示
Θ...

【技术保护点】

【技术特征摘要】
1.
一种基于
MA3C
算法的无人机协同任务规划方法,其特征在于:该方法包括以下步骤:
S1
:建立无人机模型,包括任务资源模型和无人机任务能力模型;
S2
:建立任务模型,包括独立任务模型和组合任务模型,采用有向无环图
DAG
描述组合任务模型中各子任务之间关系;
S3
:建模任务分配变量;
S4
:建模任务效用函数;
S5
:建模无人机协同任务规划约束条件,包括任务约束条件建模和无人机约束条件建模;所述任务约束条件建模包括:任务分配约束条件建模

任务执行约束条件建模和任务完成时间约束条件建模;所述无人机约束条件建模包括:无人机性能约束条件建模和无人机安全约束条件建模;所述无人机性能约束条件建模包括:无人机能量约束建模和无人机任务资源约束建模;所述无人机安全约束条件建模包括:无人机飞行距离约束建模

无人机安全约束建模和无人机禁飞区约束建模;
S6
:根据任务资源可用性

任务的时效性和无人机能耗限制确定无人机候选任务选择策略;
S7
:建模系统在时隙的状态

动作和奖励;
S8
:建模并训练
MA3C
算法;
S9
:基于
MA3C
算法确定无人机协同任务分配及轨迹规划策略
。2.
根据权利要求1所述的一种基于
MA3C
算法的无人机协同任务规划方法,其特征在于:所述
S1
中,建立无人机模型,具体包括:
N
个无人机,定义
U
n
为第
n
架无人机,
1≤n≤N
;将系统时间划分为长度相等的时隙,定义
T
为时隙总数,
τ
为每个时隙长度;无人机飞行高度固定为
h
,定义
t
时隙
U
n
的二维坐标为无人机从初始位置出发执行任务,能量耗尽前返回目的地,无人机的最大速度为
v
max
;令表示
U
n
在时隙
t
的飞行方向,
v
n,t
∈[0,v
max
]
表示
U
n
在时隙
t
的飞行速度;
U
n
在时隙
t+1
的二维位置投影为:令表示初始时刻
U
n
的能量;无人机执行任务需消耗一定资源,令
Y
表示执行任务所需资源类型的数量,表示初始时刻
U
n
所携带的第
y
种类型资源的资源量,
1≤y≤Y。3.
根据权利要求2所述的一种基于
MA3C
算法的无人机协同任务规划方法,其特征在于:所述
S2
中,建立任务模型,具体包括:系统中包含
M
个任务,定义
Θ
m
为第
m
个任务,
1≤m≤M
,由四元组表示,其中
s
m

[s
m,1
,...,s
m,Y
]
T
表示完全执行
Θ
m
所需要任务资源,
s
m,y
表示执行
Θ
m
所需要的第
y
种类型资源的资源量;
R
m
为无人机完全执行
Θ
m
可获得的收益;表示任务执行的截止时间;任务类型包括独立任务及组合任务;
独立任务无法拆分为子任务,仅当整个任务被完全执行时,才能获得相应的收益;组合任务由多个可独立执行的子任务组成,
K
m
表示
Θ
m
的子任务数量,
Θ
m,i
表示
Θ
m
的第
i
个子任务,
1≤i≤K
m
;若
Θ
m
为独立任务,则
K
m
=1,
Θ
m

Θ
m,i
;若
Θ
m
为组合任务,则
K
m
>1;子任务
Θ
m,i
建模为二元组表示,其中
s
m,i

[s
m,i,1
,

,s
m,i,y
,...s
m,i,Y
]
T
表示
Θ
m,i
所需要任务资源,
s
m,i,y
表示执行
Θ
m,i
所需要的第
y
种类型资源的资源量,
R
m,i
为完全执行
Θ
m,i
可以获得的收益;
Θ
m
的二维坐标表示为
q
m

[x
m
,y
m
]
T
;采用有向无环图
DAG
描述组合任务各子任务之间关系;令
G
m

(V
m
,E
m
,W
m
)
表示组合任务
Θ
m

DAG
,其中,
V
m

{
Θ
m,i
}
表示节点集合;
E
m

{E
m,i,j
|1≤i≠j≤K
m
}
表示子任务之间的关联关系集合,
E
m,i,j
表示连接组合任务
Θ
m
的子任务
Θ
m,i

Θ
m,j
的边;
W
m

{
ω
m,i,j
}
表示子任务之间的关联关系权重集合,其中,
ω
m,i,j
∈{0,1}
表示组合任务
Θ
m
的子任务
Θ
m,i

Θ
m,j
之间的关联关系,
ω
m,i,j
=1表示子任务
Θ
m,i
与子任务
Θ
m,j
之间存在直接的依赖关系,即子任务
Θ
m,j
需要在子任务
Θ
m,i
执行完成之后执行,否则,
ω
m,i,j

0。4.
根据权利要求3所述的一种基于
MA3C
算法的无人机协同任务规划方法,其特征在于:所述
S3
中,建模任务分配变量模型,具体包括:令
α
n,m,i,t
∈{0,1}
表示无人机任务分配变量;若
α
n,m,i,t
=1,则表示
U
n
在时隙
t
执行子任务
Θ
m,i
,否则,
α
n,m,i,t
=0,
1≤n≤N,1≤m≤M,1≤i≤K
m
,0≤t≤T。5.
根据权利要求4所述的一种基于
MA3C
算法的无人机协同任务规划方法,其特征在于:所述
S4
中,建模任务效用函数模型,具体包括:时隙
t
任务效用函数,表示为:其中,
ε1和
ε2分别为任务收益和无人机能耗的权重系数,表示任务执行收益,表示时隙
t
无人机消耗的能量;将进行建模,表示为:其中,
β
m,i,t

{0,1}
表示任务执行标识,
β
m,i,t
=1表示无人机在时隙
t
执行
Θ
m,i
,否则,
β
m,i,t
=0;1{x}
表示指示函数,若逻辑表达式
{x}
为真,则1{x}
=1,否则1{x}
=0;将进行建模,表示为:进行建模,表示为:
其中,
E
n,t
表示第
t
个时隙
U
n
消耗的能量,表示第
t
个时隙
U<...

【专利技术属性】
技术研发人员:柴蓉唐柔枝李立凡陈前斌
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1