基于强化学习的固定翼无人机防出界输入数据计算方法技术

技术编号：39505008 阅读：15 留言：0更新日期：2023-11-24 11:36

本发明专利技术涉及一种基于强化学习的固定翼无人机防出界输入数据计算方法，对于确定的训练场景，根据无人机的实时位置和场景边界，判断无人机在

全部详细技术资料下载

【技术实现步骤摘要】
基于强化学习的固定翼无人机防出界输入数据计算方法

[0001]本专利技术属于无人机导航领域，涉及一种基于强化学习的固定翼无人机防出界输入数据计算方法
。

技术介绍

[0002]近年来，随着无人机应用的深入，在一些特殊任务中，需要精准控制无人机的航行范围
。
例如，军用领域，无人机协同作战时需要在指定区域内航行；民用领域，无人机需要规避敏感区域或在指定区域内作业
(
农药喷洒等
)。
因此，无人机应具有较强的防出界能力
。
当前，越来越多的研究使用强化学习算法解决无人机的控制问题
。
在强化学习算法的应用中，其核心就是根据待解决问题及控制主体设计一组输入状态量
。
强化学习算法就是根据输入信息训练智能体控制无人机执行指定任务
。
当输入不同时，对于执行同一任务的智能体，其性能差异较大
。
因此，设计一组合理的输入对智能体
(
根据强化学习算法训练
)
控制效果有较大影响
。
[0003]在
《
一种基于强化学习的
AGV
路径规划方法及系统
》(
专利，公布号：
CN113485380A
，公布日期：
2021.10.08)
中，通过提出的方法实现了自动导向车
(AGV)
的路径规划
。
在
《
一种基于多智能体...

【技术保护点】

【技术特征摘要】
1.
一种基于强化学习的固定翼无人机防出界输入数据计算方法，其特征在于根据无人机位置以及边界位置，计算无人机在
XOY
平面中与边界的距离数据，将距离数据输入至控制无人机强化学习的智能体中，控制无人机防出界；输入数据计算步骤如下：根据无人机的实时位置
p
＝
[p
x
,p
y
]
，以及无人机训练场景的范围
R
＝
[r
x
,r
y
]
，判断无人机在
XOY
平面的朝向，其中
r
x
∈[x
min
,x
max
]
，
r
y
∈[y
min
,y
max
]
；所述判断无人机在
XOY
平面的朝向准则是：判断
p
x
与
x
min
是否正负相同；判断
p
x
与
x
max
是否正负相同；判断
p
y
与
y
min
是否正负相同；判断
p
y
与
y
max
是否正负相同；根据无人机在
XOY
平面的朝向，按照无人机的航向角，计算无人机到与其朝向相关的两个边界的距离
dist1
，
dist2
，具体为：当无人机的航向角
θ
满足0＜
θ
≤90
°
时，计算无人机到直线
x
＝
y
max
以及直线
y
＝
x
max
的距离
dist1,dist2
；当无人机的航向角
θ
满足
90
＜
θ
≤180
°
时，计算无人机到直线
y
＝
x
min
以及直线
x
＝
y
max
的距离
dist1,dist2
；当无人机的航向角
θ
满足
180
＜
θ
≤270
°
时，计算无人机到直线
x
＝
y
min
以及直线
y
＝
x
min
的距离
dist1,dist2
；当无人机的航向角
θ
满足
270
＜
θ
≤360
°
时，计算无人机到直线
x
＝
y
max
以及直线
y
＝
x
min
的距离
dist1,dist2
；将
dist1,dist2
作为状态量的一部分输入给控制无人机的智能体
。2.
根据权利要求1所述基于强化学习的固定翼无人机防出界输入数据计算方法，其特征在于：所述判断无人机在
XOY
平面的朝向的根据是：计算
xMin
＝
p
x
·
x
min
，若
xMin≥0
则
p
x
与
x
min
正负相同，否则
p
x
与
x
min
正负相反；计算
xMax
＝
p
x
·
x
max
，若
xMax≥0
则
p
x
与
x
max
正负相同，否则
p
x
与
x
max
正负相反；计算
yMin
＝
p
y
·
y
min
，若
yMin≥0
则
p
y
与
y
min
正负相同，否则
p
y
与
y
min
正负相反；计算
yMax
＝
p
y
·
y
max
，若
yMax≥0
则
p
y
与
y
max
正负相同，否则
p
y
与
y
max
正负相反
。3.
根据权利要求1所述基于强化学习的固定翼无人机防出界输入数据计算方法，其特征在于：所述当无人机的航向角
θ
满足0＜
θ
≤90
°
时，计算无人机到直线
x
＝
y
max
以及直线
y
＝
x
max
的距离
dist1,dist2
时，
dist1
的获取：如果
p
y
与
y
max
正负相同，
dist1
＝
y
max
‑
p
y
，如果
p
y
与
y
max
正负相反且
p
y
≤y
max
，
dist1
＝
|y
max
|+|p
y
|
，否则
dist1
＝
|y
max
|
‑
|p
y
|
；
dist2
的获取：如果
p
x
与
x
max
正负相同，
dist2
＝
x
max
‑
p
x
，如果
p
x
与
x
max
正负相反且
p
x
≤x
max
，
dist2
＝
|x
max
|+|p
x
|
，否则
dist2
＝
|x
max
|
‑
|p
x
|。4.
根据权利要求1所述基于强化学习的固定翼无人机防出界输入数据计算方法，其特征在于：所述当无人机的航向角
...

【专利技术属性】
技术研发人员：祝小平，王飞，祝宁华，
申请(专利权)人：西安爱生技术集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人